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PRESENTATION 


Ce trente-neuviéme numéro de la revue Lalies réunit les textes issus de la session de 
linguistique et de littérature de l'association Clélia qui s'est tenue à Évian-les-Bains du 
20 au 24 août 2018, grâce à l’aide financière du Labex TransferS. Cette session s'est 
signalée par la qualité des conférences et la richesse des contributions proposées à titre 
de varia, trés nombreuses dans ce volume. Je tiens à exprimer toute ma gratitude au 
département des Sciences de l'Antiquité et à sa directrice, Christine Mauduit, pour le 
soutien financier qui a permis à Lalies 39 de paraitre. Mes plus vifs remerciements vont 
aussi à Laurence Debertrand, des éditions Rue d'Ulm, dont le travail précis et efficace 
de mise en forme du volume a permis sa parution rapide, à Lucie Marignac, directrice 
des éditions Rue d'Ulm, pour son soutien indéfectible à la publication de Lalies, ainsi 
qu'à Marie-Héléne Ravenel qui a également contribué à la genése de ce numéro. Les 
membres du comité de rédaction de Lalies 39 m'ont été d'une aide précieuse par l'acribie 
et la ponctualité de leurs relectures : qu'ils en soient ici chaleureusement remerciés. Je 
ne saurais enfin exprimer suffisamment ma reconnaissance à Daniel Petit qui m'a guidée 
et soutenue tout au long de ce processus d'édition. Je suis extrémement touchée de la 
confiance qu'il m'a témoignée en me proposant de prendre en charge la publication de 
cette revue qu'il a éditée avec le plus grand soin depuis le numéro 20, paru en 2000, 
et je joins mes remerciements à ceux de tous les membres de l'association Clélia pour 
le dévouement avec lequel, année aprés année, il s'est attaché à faire paraitre dans les 
meilleures conditions les actes de nos sessions. 

Ce volume 39 s'ouvre sur un article de Thierry Poibeau qui offre une présentation trés 
complete et trés instructive du traitement automatique des langues. Aprés un historique 
du développement de ce domaine de recherche, et plus particuliérement de ce qui touche 
à la traduction automatique, il en explique les principaux enjeux en insistant sur les 
avancées déjà réalisées et sur les difficultés actuellement rencontrées, avant de proposer 
un tour d'horizon de ses diverses applications. Sa présentation insiste sur les rapports 
entre traitement automatique des langues et linguistique, non seulement pour ce qui est 
des questions de syntaxe, de morphosyntaxe ou de sémantique, mais encore pour l'étude 
des langues de terrain, l'acquisition du langage ou la typologie linguistique. 

La présentation du BCMS, le bosniaque-croate-monténégrin-serbe, proposée par 
Marijana Petrovié est centrée sur les problèmes liés au contexte sociopolitique dans lequel 
cette langue est actuellement employée. A la suite de l’éclatement de la Yougoslavie, les 
quatre pays qui en sont issus et qui partagent une méme langue ont fait de celle-ci un enjeu 
d'identification nationale en tentant d'établir quatre standards linguistiques différents. 

Casper de Jonge propose dans sa contribution une typologie des interactions et 
connexions qui existent entre critique littéraire grecque et poésie latine, un domaine de 
recherches longtemps négligé. Il étudie ensuite les différents liens qui existent entre le 
traité sur La Composition stylistique de Denys d’ Halicarnasse et |’ Art poétique d' Horace. 
L'auteur s'intéresse pour finir aux rapports entre la conception du sublime exposée dans le 
traité Sur le sublime de Longin et le passage du livre VI de l’Énéide sur le silence de Didon 
lors de sa rencontre avec Énée aux Enfers, en recourant de surcroit à la théorie moderne 


des passages à forte intensité émotionnelle qui présentent bien des points communs avec 
les moments sublimes de Longin. 

La section des varia est particuliérement fournie cette année. Dans le premier article, 
Cécile Tep se livre à une analyse générique de l'ode III, 28 d'Horace appuyée sur des 
considérations métriques et propose d'y voir un glissement du genre symposiaque au genre 
de la nénie, qui passe par une inclusion du genre de l'hymne. Marie de Toledo théorise, 
quant à elle, les enjeux d'un procédé critique, l'autométatextualisation de la difficulté, 
qui consiste à considérer que le texte commenté s'autodésigne comme difficile, avant 
d'examiner sa mise en œuvre dans les commentaires de l' Alexandra de Lycophron. Le 
texte d'Alain Christol présente une typologie des ethnonymes et passe en revue différents 
choix de désignation de peuples, qu'il s'agisse de noms anciens ou de noms plus modernes. 
Le volume se clót sur un texte à visée pédagogique qui promeut l'introduction de la 
critique textuelle dans les cours de langues anciennes. Victor Gysembergh y donne tous 
les éléments pour se lancer : principes généraux, bibliographie commentée et exemples 
concrets d'utilisation dans le cadre d'un cours. 


Frédérique Fleck 

Lalies 

École normale supérieure 
45 rue d'Ulm 

F-75230 Paris CEDEX 05 
frederique.fleck@ens.fr 
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LE TRAITEMENT AUTOMATIQUE DES LANGUES : 
TENDANCES ET ENJEUX 


Thierry PoIBEAU ! 


RÉSUMÉ 

Le traitement automatique des langues (TAL) est un domaine de recherche pluridisciplinaire, à 
l'intersection de la linguistique et de l'informatique, qui vise à mettre au point des programmes 
informatiques pour l'analyse des langues par ordinateur. Ce domaine de recherche est apparu au 
début des années 1950, en méme temps que la mise au point des premiers ordinateurs. Il s’est depuis 
largement diversifié et les applications de traitement automatique des langues se sont imposées 
dans la vie courante, que ce soit a travers les correcteurs orthographiques, les outils de traduction 
automatique ou la commande a la voix des téléphones portables ou des enceintes connectées. Au-dela 
de l'aspect parfois gadget des applications courantes, cet article essaie d'expliquer les difficultés de 
la táche et les grandes évolutions du domaine; il vise, en outre, à dresser un panorama des recherches 
en cours et des outils disponibles. Cet article est aussi l'occasion d'une réflexion sur la place de la 
linguistique dans le paysage actuel de la recherche en traitement automatique des langues. 


ABSTRACT 


Natural language processing (NLP) is a domain of research that aims at producing computer models 
for the automatic analysis of languages. The domain emerged in the early 1950s, along with the 
development of the first computers. It has since then evolved a lot and has given birth to popular 
applications of everyday life: spell checkers, machine translation tools or voice control for mobile 
phones and connected speakers. Beyond the gadget-like aspect of some common applications, this 
article tries to explain the difficulties of NLP and the major developments in the field ; it also aims 
at providing an overview of current research and tools. Finally, in the course of this paper, we will 
examine to what extent linguistics still play a role in the field. 


1. INTRODUCTION : QUELQUES REMARQUES SUR LA SITUATION ACTUELLE DU 
TRAITEMENT AUTOMATIQUE DES LANGUES ET SUR LA PLACE DE LA LINGUISTIQUE 
EN SON SEIN 


Le traitement automatique des langues (TAL) est un domaine de recherche pluridisciplinaire 
à l’intersection de la linguistique et de l'informatique?. En guise de définition liminaire, 
on peut dire que le TAL concerne essentiellement l'analyse des langues au moyen d'un 
ordinateur. Le TAL est aussi connu sous diverses appellations qui traduisent parfois des 
nuances au sein de ce vaste domaine de recherche : on parle par exemple d'«ingénierie 
linguistique », quand l'accent est mis sur les aspects pratiques et opérationnels, ou de 
« linguistique informatique », quand c'est la linguistique qui tient un róle important 
dans les recherches. Notre définition est aussi trop restrictive dans la mesure ou le TAL 


1. Cetarticle a bénéficié de la relecture attentive et bienveillante d' Audrey Mathys, de Pedro Duarte et de 
Frédérique Fleck. Leurs remarques ont permis d'en améliorer grandement le contenu : qu'ils en soient 
remerciés ! Toutes les éventuelles erreurs et imprécisions demeurant sont évidemment de mon fait. 


2. Sabah (1988 et 1989), Poibeau (2003 et 2011) et Léon (2015). 
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recouvre également la « génération de texte», c'est-à-dire la production (et non l'analyse) 
automatique de textes, théme de recherche populaire aujourd'hui, à l'heure des agents 
conversationnels et autres gadgets fondés sur une interaction avec l'utilisateur (pour qu'il 
y ait interaction, il faut prévoir à la fois une étape d'analyse et une étape de génération). 

Il faut dés à présent souligner que ce domaine a subi des mutations extrémement 
importantes en quelques années, et que ce qui se fait aujourd'hui sur le plan technique 
n'a plus grand chose à voir avec ce qui se faisait il y a encore quelque temps de cela?. Du 
point de vue du grand public, le domaine a longtemps été connu essentiellement à travers 
les correcteurs orthographiques et les traducteurs automatiques, qui étaient de surcroit 
souvent de qualité médiocre. À l'inverse, il existe aujourd'hui de plus en plus d'applications 
visibles, opérationnelles et relativement efficaces. Tous les problémes ne sont pas résolus et 
les systèmes automatisés font toujours des erreurs, mais le domaine a connu ces dernières 
années des réussites indéniables. La qualité des traductions, au moins du frangais vers 
l'anglais, devient de plus en plus satisfaisante, on peut maintenant converser avec un agent 
artificiel de manière relativement efficace (on pensera à Siri d' Apple, à OK Google ou à 
Alexa d'Amazon), les moteurs de recherche sont de plus en plus précis et corrigent d'eux- 
mêmes certaines fautes de frappe, suggèrent des alternatives, etc. Pour la première fois 
depuis quelques années, des applications se répandent et sont utilisées par le grand public. 

La situation présente s'explique par des progrès récents extrêmement importants, qui 
n’ont pas grand-chose à voir avec la linguistique, mais qui sont avant tout techniques. Deux 
éléments principaux expliquent pour l’essentiel la situation présente (et plus généralement 
les progrès relativement réguliers depuis 25 ans) : d’une part la masse de données textuelles 
disponible sur Internet; d’autre part la puissance de calcul des machines, en constante 
augmentation. Le développement de ce que l’on appelle l’«Intelligence artificielle» et, au 
sein de ce domaine, le développement de l’«apprentissage artificiel », a considérablement 
renouvelé le TAL? : contrairement à ce que l’on pensait il y a encore quelques décennies 
(et contrairement à ce que pensent encore aujourd’hui certains collègues, probablement), 
il est extrêmement efficace d’« apprendre » depuis les données. Nous reviendrons sur ce 
terme : il s’agit d’un abus de langage, l’ordinateur n’apprend rien à proprement parler, 
mais on a aujourd’hui accès à tant de données qu'il est possible de repérer des régularités 
et plus globalement des «faits de langue» en quantité suffisante pour obtenir des systémes 
efficaces et capables d'analyser et même de produire des phrases variées et complexes, 
dans une multitude de langues. 

Ona longtemps pensé que le développement d'un systéme de traduction automatique, par 
exemple, nécessitait de formaliser sur ordinateur toute la langue et méme les connaissances 
de sens commun, car celles-ci sont nécessaires pour déterminer le sens en contexte?. Pour 
prendre un exemple simple et un peu artificiel, si on me dit : « L'avocat est entré dans la pièce», 
je comprends immédiatement que «l'avocat» désigne un humain exerçant un métier lié à la 
justice, qu'il est probablement le défenseur d'une personne accusée de quelque chose, etc. 
Je ne vais pas considérer l'option «avocat qui se mange» (avocat fruit) car cette acception 
serait trés étonnante ici : un avocat (fruit) se mange, mais n'entre pas dans une piéce car 
il ne peut pas se mouvoir. Cela est évident pour tout le monde, c'est méme enfoncer une 
porte ouverte que de le dire. Mais si Je développe un systéme automatique, je vais avoir 
affaire à un mot («avocat»), avec au moins deux significations (et peut-être plus, il peut 
aussi étre l'avocat des parties civiles, ce qui est différent du sens le plus commun du mot 
«avocat» comme «homme de loi, qui défend un accusé» etc.), et il faudra que Je conçoive 


3. Adda-Decker et al. (2014). 
4. Gilleron (2019). 
5.  Poibeau (2017). 
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des règles capables de prédire le sens en contexte. Or, il s'agit d'une connaissance difficile 
à modéliser. L’ordinateur, lui, va analyser les contextes d'apparition du mot à partir de très 
grands corpus, en tirer des régularités (simplement via des cooccurrences, c'est-à-dire des 
associations de mots apparaissant ensemble) qui permettent une désambiguisation (c'est-à- 
dire le choix d'un sens parmi un ensemble de sens) assez efficace, en tout cas plus efficace 
que ce que ferait n'importe quel humain aprés un trés long travail d'analyse manuelle. 
Cela est particuliérement vrai pour une tache comme la désambiguisation sémantique, 
c’est-à-dire la tâche consistant à trouver le sens d'un mot en contexte parmi un ensemble de 
sens possibles listés dans un dictionnaire. Il existe 50000 mots dans un dictionnaire courant 
(et bien davantage si on prend en compte les mots composés). Il est dés lors impossible 
pour un humain d'énumérer tous les contextes possibles et de concevoir des régles de 
désambiguisation efficaces en pratique : personne ne peut imaginer tous les emplois d'un 
mot, et méme en se fondant sur des dictionnaires et des encyclopédies, la tache reste quasi 
impossible car il faut aussi considérer les textes réels, pour voir l'usage réel des mots en 
contexte. L'ordinateur est au contraire infiniment efficace pour cela : il va enregistrer sans 
probléme, en un instant, tous les contextes possibles pour tous les mots du dictionnaire 
et, si un programme efficace a été concu, il va méme pouvoir analyser le sens des mots 
automatiquement en examinant la diversité et la dispersion des contextes observés (plus un 
mot apparait dans des contextes variés, plus il a des chances d'étre polysémique). 
Évidemment, comme on l'a dit, méme avec les progrés récents, les systémes ne sont pas 
parfaits. Il existe toujours des contextes difficiles ne permettant pas une désambiguisation 
aisée des mots : il faut que le systéme dispose d'assez de données pour inférer des régles 
efficaces ; il faut que le domaine visé soit proche du domaine qui a servi à mettre au 
point le systéme initial, sinon le processus ne va pas fonctionner, etc. Ainsi, la traduction 
automatique fonctionne relativement correctement pour les langues indo-européennes 
bien représentées sur Internet. Les systémes sont nettement moins bons quand il s'agit 
de traduire vers le chinois, l'arabe ou le japonais : bien que l'on dispose de données et 
que de nombreuses recherches aient été faites, la structure et la complexité des langues 
jouent évidemment un róle, et il est plus difficile de traduire vers des langues distantes 
que vers des langues proches. On voit cela aussi pour les langues indo-européennes. Il 
est par exemple plus facile de traduire de l'allemand vers l'anglais que de l'anglais vers 
l'allemand car on sait relativement bien analyser les mots composés de l'allemand, mais on 
sait beaucoup moins bien comment produire des mots composés bien formés en allemand. 
Il n'empéche : on a aujourd'hui affaire à des masses de données si grandes, au 
moins pour quelques langues «dominantes » et bien représentées sur Internet, que les 
approches automatiques sont devenues trés efficaces et elles sont méme utilisées dans 
différents cadres opérationnels. La recherche est devenue depuis 25 ans de plus en plus 
technique, informatique voire mathématique, laissant au second plan (voire au dernier 
plan) la linguistique : pour le dire trés directement, la linguistique a quasiment disparu des 
conférences de TAL, au moins la linguistique telle qu'on la connait traditionnellement. 
Ce que l'on appelait « grammaire formelle» par exemple avait non seulement sa place 
dans le domaine, mais elle occupait méme une place centrale. On partait alors de l’idée 
que les données brutes (c'est-à-dire les corpus) étaient trop disparates pour pouvoir étre 
analysées directement. Une étape de normalisation et de formalisation était nécessaire au 
préalable pour parvenir à une analyse réellement opérationnelle. Les approches récentes, 
à l'inverse, se fondent directement sur l'analyse de corpus massifs, par des techniques 
brutes (on voit depuis une dizaine d'années un quasi-monopole des réseaux de neurones, 


6. Navigli (2009). 
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a travers ce que l'on appelle «l'apprentissage profond» ou le «deep learning») sans 
préanalyse du corpus. 

Ces aspects opérationnels connaissent des succès indéniables mais ne doivent pas 
cacher certaines faiblesses. On sait que la distribution du lexique est très hétérogène 
(c'est ce que montre la loi de Zipf) : quelques mots sont trés fréquents (les articles, 
les prépositions, etc.), mais beaucoup d'autres mots sont trés peu fréquents en corpus 
(méme avec un trés gros corpus, on trouvera beaucoup d'hapax et plus généralement de 
mots apparaissant seulement quelques fois) et, entre les deux, une zone réduite de mots 
relativement fréquents (les noms et les verbes les plus courants par exemple). La langue 
suit généralement ce modèle? : quelques règles de grammaire s'appliquent quasiment à 
toutes les phrases (la présence d'un sujet dans la phrase, par exemple, et le fait que celui-ci 
précéde généralement le verbe, etc.) tandis que beaucoup de régles ne s'appliquent que 
dans de trés rares cas. Les mots ont de trés nombreux sens rares (d'un simple point de 
vue statistique) que l'on peut quasiment négliger si on souhaite développer un systéme 
opérationnel généraliste (le systéme fonctionnera bien dans la plupart des cas), etc. C'est 
ce qui explique à la fois le succés des systémes mis au point sur le plan opérationnel, et 
en partie la quasi-disparition des linguistes de ce domaine. 

Ainsi, dans les années 1980, la Commission européenne avait lancé un grand programme 
de recherche transnational autour de la traduction automatique. Le but était de produire 
des systémes opérationnels, ou du moins «à l'état de l'art» (c'est-à-dire au meilleur 
niveau des performances d'alors), entre les principales langues européennes. Quelques 
années plus tard, de nombreuses théses avaient été produites sur la négation (ou, plus 
exactement, sur la portée de la négation) dans différentes langues européennes et sur 
la facon d'en rendre compte d'une langue à l'autre. Il s'agissait probablement d'un 
probléme linguistique intéressant, mais cela n'avait quasiment aucun intérét pratique pour 
la traduction automatique (si l'on cherche à traduire des articles de journaux, la portée de 
la négation est rarement un probléme). Il s'agit là d'une anecdote, mais elle révéle bien, 
à notre avis, l'écart entre les préoccupations des linguistes et celles des informaticiens. 

Cet écart s'est sans doute réduit depuis les années 1980 (Internet est «passé par là», 
de méme que le recours aux corpus massifs et aux outils automatiques, méme pour les 
linguistes éloignés du TAL : on peut bien évidemment continuer à faire de la linguistique 
sans avoir systématiquement recours à l'ordinateur (et c'est heureux !), mais, d'un autre 
côté, le TAL est devenu tellement technique qu'il n'est pas facile pour un linguiste d'y 
trouver sa place. Depuis 25 ans les experts prédisent que les performances vont atteindre 
un «plateau» et que les systémes, pour progresser, vont devoir intégrer «davantage de 
linguistique », mais cette promesse a toujours été repoussée jusqu'ici. L'avénement de 
l'apprentissage profond a encore repoussé cette échéance, les systémes ayant connu un 
«bond de performance » par le simple usage de cette technique. Il est toutefois vrai que 
les chercheurs essaient de plus en plus d'intégrer des «connaissances linguistiques » dans 
les systémes, c'est-à-dire en général des ressources mises au point par des linguistes. 

Le but de ce texte n'est pas de faire le simple constat d'un divorce entre les deux 
domaines : d'un cóté le TAL, et de l'autre la linguistique. Il s'agit au contraire d'appréhender 
les avancées du domaine, d'essayer de comprendre la situation actuelle et le type de 
techniques utilisées en TAL, et enfin de voir comment le TAL peut aujourd'hui servir de 
«marchepied» à des recherches en linguistique, ou plus généralement en littérature ou 
en sciences humaines et sociales. 

L'exposé commence par un examen rapide des principales difficultés du traitement 
automatique des langues, afin de mettre en perspective les succés et les échecs des soixante-dix 


7.  Lebart et Salem (1994). 
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dernières années (section 2). La section suivante dresse un rapide survol historique du 
domaine, en se focalisant plus particulièrement sur la traduction automatique, l'application 
emblématique du TAL (section 3). L'exposé se poursuit avec un panorama des recherches 
actuelles, de la morphosyntaxe à la sémantique (section 4) et avec une présentation des 
techniques d'évaluation (section 5). On examine ensuite les applications du TAL à la 
linguistique (section 6), puis les applications à destination du grand public (section 7) 
avant de finir par les applications en lettres et sciences sociales, et plus globalement par 
les liens entre TAL et «humanités numériques» (section 8). L'exposé se termine enfin 
par une conclusion et une bibliographie qui permettra au lecteur d'aller plus loin sur 
certains aspects du probléme. 


2. POURQUOI L'ANALYSE DE LA LANGUE PAR ORDINATEUR EST-ELLE DIFFICILE ? 
LA QUESTION DE L’AMBIGUÏTÉ 


Le TAL est difficile parce que l'ordinateur n'a a priori aucune connaissance de la langue. 
Il faut donc lui indiquer ce qu'est un mot, une phrase, etc. Jusque-là, les choses peuvent 
sembler relativement simples. En fait, il faut bien voir que dés ce niveau, la langue est 
complexe et ambigué. Prenons deux exemples. L'apostrophe marque l'élision d'une lettre 
entre deux mots, comme dans «l'éléphant» (la lettre finale e de l’article défini est élidée 
devant un mot à initiale vocalique) et donc l'apostrophe peut étre considérée comme un 
séparateur de mots. Cela est vrai en général, mais une séquence comme «aujourd'hui » 
est généralement considérée comme formant un seul mot, qui posséde pourtant une 
apostrophe (qui ne joue plus alors son róle de séparateur). Le tiret pose aussi des 
problémes redoutables, et peut étre soit un séparateur (« Rendez-vous, vous étes cernés ! »), 
soit une partie du mot (« J'étais en retard à mon rendez-vous»). Dans le premier exemple, 
«rendez» est un verbe à l’impératif, tandis que dans le second exemple, «rendez-vous » 
est un nom dont les parties ne doivent pas étre séparées lors de l'analyse (méme si, étymo- 
logiquement, on peut décomposer le mot, mais ce type d'analyse n'aurait pas de sens 
ici, dans le cadre d'un systéme de traitement automatique des langues qui n'a pas à tenir 
compte de l'étymologie). Le probléme est en fait beaucoup plus prégnant : quasiment 
chaque mot, chaque expression et chaque phrase peuvent être ambigus?*. 

Prenons un exemple : «l'avocat a livré une plaidoirie au vitriol». Chaque mot introduit 
de nombreuses difficultés pour un ordinateur. Pour un humain, il est par exemple évident 
que «avocat» désigne un juriste, «a livré» correspond au verbe et que «au vitriol » 
est une expression figée. Il n'en va pas de méme pour un ordinateur : «avocat» peut 
désigner un fruit ; «livré» peut facilement étre identifié comme un verbe mais le sens est 
ici largement métaphorique : il n'y a pas de livraison à proprement parler dans la phrase. 
Les compléments prépositionnels posent eux aussi des problémes redoutables : comment 
savoir que «au vitriol» est rattaché à « plaidoirie» et non au verbe «livré» ? Si on avait 
eu affaire à la phrase «l'avocat a livré une plaidoirie au palais de justice », le complément 
«au palais de justice » aurait dû être rattaché au verbe et non au nom « plaidoirie », alors 
que la structure des deux phrases semble tout à fait comparable de prime abord. 

On pourrait objecter à cela que «au vitriol» est une expression figée qui doit étre 
enregistrée comme un tout (c'est-à-dire comme une entrée à part entiére) dans le 
dictionnaire. Cela est probablement vrai mais ne fait ainsi que repousser le probléme 
dans la mesure où cette stratégie revient à augmenter le nombre de mots et d'expressions, 
ce qui a pour conséquence d'introduire de nouvelles ambiguités, et finalement de rendre 
le probléme sans fin. 


8. Fuchs (1996). 
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Un dictionnaire du frangais courant contient en général entre 50000 et 100000 mots 
(hors noms propres). Quand on considère toutes les formes que l'on trouve effectivement 
dans les textes (un verbe comme « livrer» correspond en fait à plusieurs dizaines de formes 
conjuguées : «livrions », «livraient», « livrera», etc.), il est admis qu'il faut multiplier ce 
chiffre par huit environ en francais. À cela, il faut ajouter les noms propres (on trouve des 
dictionnaires de plusieurs millions de noms propres, la plupart étant homonymes de noms 
communs, comme « Pierre » qui peut étre confondu avec une «pierre », méme si l'usage 
des majuscules limite le probléme en frangais) et les dictionnaires de mots composés 
(qui peuvent aussi inclure plusieurs dizaines de milliers d'items). Enfin, chaque domaine 
technique est lui-même susceptible d'inclure de nombreux termes spécifiques, souvent 
homonymes d'autres mots de la langue. 

Les problémes d'analyse syntaxique s'ajoutent à cela (dans notre exemple ci-dessus, 
faut-il rattacher «au vitriol» à «plaidoirie» ou au verbe «a livré» ?) et l'on voit qu'on a 
trés rapidement affaire à un probléme d'explosion combinatoire. La plupart des problémes 
peuvent être résolus facilement, de manière locale (par exemple avec des heuristiques du 
type «comme “plaidoirie” apparait dans le contexte du mot "avocat", ce dernier désigne 
probablement l'homme de loi et non le fruit») mais d'autres problémes nécessitent des 
connaissances plus complexes, difficiles à concevoir de maniére exhaustive quand on a 
affaire à des millions d'items. 

Il peut sembler paradoxal que tout cela ne pose aucun probléme de compréhension à 
un humain, qui ne voit méme pas qu'il y a ambiguité (au sens ou il faut choisir la bonne 
étiquette, le bon sens, le bon rattachement de chaque mot pour comprendre la phrase). 
De fait, cette dimension de la compréhension humaine a longtemps échappé aux concepteurs 
de systèmes automatiques, tant la compréhension est un phénomène naturel, direct et 
inconscient pour un humain. Il est d'ailleurs trés improbable que le cerveau analyse toutes 
les possibilités pour chaque mot afin d'obtenir une représentation sémantique pour une 
phrase donnée : gráce au contexte, le cerveau accéde probablement directement à la bonne 
interprétation, sans méme considérer les analyses alternatives. À ce sujet, il a parfois été 
proposé un paralléle avec le cube de Necker, cette représentation des arétes d'un cube 
en perspective cavalière (figure 1). 


Figure 1. Le cube de Necker, une illusion d'optique 
publiée par Louis Albert Necker en 1832°. 


Le dessin est ambigu dans la mesure où rien n’indique a priori quelle est la face du cube 
la plus proéminente. Le cerveau interpréte cependant naturellement la figure afin d'en 
obtenir une représentation valide (on peut voir alternativement deux cubes différents 
mais ces perceptions ne sont jamais simultanées car le résultat ne serait pas conforme à 
une représentation valide, ou tout au moins aux conceptions prédéfinies dans le cerveau 
par observation de la réalité). Les dessins paradoxaux d' Escher fonctionnent aussi sur ce 


9. Source de l'illustration : https://fr.wikipedia.org/wiki/Cube de NeckerZ/media/File:Necker cube.svg 
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principe, sauf que ces dessins n'offrent pas une vue logique du monde mais à l'inverse 
contredisent nos conceptions prédéfinies de l'espace. 

Nous mentionnons ces exemples pour illustrer le fait que le cerveau interprète et 
éventuellement modifie les perceptions (visuelles ou auditives) suivant des schémas 
préconstruits. Ou, plus exactement et suivant les principes de la Gestalt °, il y a une 
co-détermination simultanée des parties et de la forme globale : le contexte permet de 
déterminer le sens des mots qui, eux-mémes, permettent de déterminer le sens de la phrase 
et ce de façon simultanée !!. 


3. UN DOMAINE EMBLÉMATIQUE DU TAL : LA TRADUCTION AUTOMATIQUE 


Dés les débuts du traitement automatique des langues, juste aprés la seconde guerre 
mondiale, deux domaines liés au traitement automatique des langues naturelles sont 
apparus comme étant d'une importance fondamentale : la recherche d'information et la 
traduction automatique '*. Le premier domaine visait à retrouver des informations parmi 
de grandes bases documentaires ou de grands ensembles d'archives, et à gérer des index 
complexes : le domaine donnera naissance aux bases de données, entre autres choses. 
L'autre secteur est celui de la traduction automatique : dans le contexte de la Guerre 
froide, traduire, du russe vers l'anglais en particulier, est trés vite apparu comme un 
enjeu prioritaire ?. Au-delà des aspects applicatifs immédiats, ce domaine de recherche 
a aussi été jugé important car il met en jeu toute la complexité du langage : la nécessité 
de comprendre le texte source, de le représenter formellement et de produire (on dit 
« générer») un texte comme résultat, dans la langue cible. 

La période de l'aprés-guerre se nourrit en fait d'un ensemble de réflexions sur la 
langue, sur ses particularités et sur ce que devrait viser un programme d'intelligence 
artificielle, c'est-à-dire un programme qui imiterait l'intelligence humaine. À cóté de 
la traduction, le dialogue humain-machine est aussi étudié en détail car si une machine 
savait dialoguer, cela veut dire qu'elle pourrait — un peu de la même façon que pour la 
traduction automatique — comprendre, analyser ce qui est dit et produire des énoncés en 
retour pour alimenter la conversation de fagon pertinente. Turing en particulier imagine 
différents dispositifs, dont le célèbre test de Turing '* : le test est réussi si un humain, 
dialoguant par écran interposé, est incapable de dire si son interlocuteur est un humain 
ou une machine (ou, alternativement, si la personne, dialoguant avec deux interlocuteurs 
— un humain et une machine -, est incapable de discerner l'humain de la machine) ... 
La période de l’après-guerre fourmille de ces discussions sur ce qu'est l'intelligence, 
sur ce qu'il est possible de reproduire avec un ordinateur et sur la maniére dont on peut 
le simuler, le tester, l'évaluer. 

Assez rapidement on se rend compte du caractére ambivalent du dialogue humain- 
machine. Ce domaine restera toujours un domaine important du traitement automatique 
des langues, mais celui-ci ne nécessite pas obligatoirement une analyse poussée : il est 
en effet possible d'instaurer un dialogue assez réaliste sans compréhension du contenu 


10. Guillaume (1979). 


1l. Victorri et Fuchs (1996). À l'inverse, la publicité joue fréquemment sur le maintien d'une ambiguité 
volontaire de sens (par exemple dans un slogan comme «II a Free, il a tout compris»). Beaucoup de 
personnes ne voient d'ailleurs pas le double sens spontanément, ce qui montre qu'en situation normale, 
le cerveau sélectionne naturellement un sens particulier et évite au maximum la double analyse. 


12. Léon (2015). 
13. Poibeau (2017). 
14. Turing (1950). 
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textuel, aussi étrange que cela puisse paraître ^. Ainsi, Weizenbaum développe dans les 
années 1960 Eliza, un systéme de dialogue qui repére des structures conversationnelles 
typiques et génére des questions réalistes simplement sur la base de ce qui a déjà été dit 
(par exemple, à partir de «Je n'ai pas aimé ce film», l'ordinateur reconnait le patron 
«Je n'ai pas aimé X» avec «X = ce film» et peut proposer trés simplement une question 
comme « Pourquoi n'avez-vous pas aimé ce film? » pour relancer le dialogue). La traduction 
ne peut pas se contenter de techniques aussi pauvres, méme si une traduction mot à mot 
peut servir à développer des systémes opérationnels à moindre coüt. Pour obtenir une 
traduction de bonne qualité, il est nécessaire d'avoir une compréhension en profondeur 
du texte à traduire — c'est du moins ce que pensaient les premiers acteurs du domaine. 


3.1. Les années 1940 : les débuts du TAL 


Comme on l'a signalé, la traduction automatique est vue comme une application clé 
dès l'immédiat aprés-guerre, avant méme l'apparition des premiers ordinateurs. Ce 
désir d'automatisation et de formalisation du langage faisait écho à de trés nombreuses 
recherches et réflexions menées dès les siècles précédents par nombre de savants et de 
penseurs, comme Leibniz ou Descartes. 

L'aprés-guerre est marquée à la fois par un besoin — traduire du russe vers l'anglais 
— et par des avancées majeures qui ont eu lieu pendant la guerre dans le domaine de la 
cryptographie. La cryptographie vise à traduire dans un langage compréhensible 
(typiquement, une langue humaine), un message codé suivant une procédure complexe. 
C'est à cette époque que Claude Shannon et Warren Weaver, deux savants américains 
qui ont travaillé dans le domaine de la cryptographie pendant la guerre, puis dans ce qui 
deviendra l'informatique, proposent leur célébre schéma de la communication (1949), 
tel que présenté dans la figure suivante (figure 2). 


Codage Décodage 
Message Signal Signal Message 


Figure 2. Le schéma de la communication d’après Shannon et Weaver '°. 


Ici, une source veut émettre un message. Celui-ci doit étre encodé par l'émetteur : il peut 
s'agir par exemple de la traduction en morse d'un message en langue naturelle, ou tout 
simplement de la mise en mots d'idées que le locuteur souhaite émettre (si l'on imagine qu'il 
peut exister des idées abstraites dans la tête du locuteur, indépendamment de sa langue de 
communication) — le modèle était à l’origine essentiellement un modèle abstrait à des fins 
d'analyse du signal, mais il a depuis été largement appliqué à la communication humaine. 
Le message est ensuite transmis par un canal qui peut être « bruité», parce que le message 
circule dans un environnement soumis à divers aléas (bruit de fond, affaiblissement du 
signal en fonction de la distance, etc.). Ce message est enfin intercepté par un récepteur qui 
doit le décoder (transformer le message en morse ou en un message en langue naturelle, ou 


15. Landragin (2013). 
16. Source de l'illustration : Picard (1992). 
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interpréter des mots pour en inférer des idées). Le schéma de Shannon a donc une portée 
trés large, il sera largement repris et reste encore largement étudié, en introduction aux 
formations traitant aussi bien de théorie de la communication que du traitement du signal. 

À la méme période, et avant que ce schéma ne s'impose, une idée similaire fait son 
chemin pour ce qui concerne la traduction automatique : ne pourrait-on pas considérer 
un texte en langue étrangére comme un message codé, qu'il faudrait analyser et traduire 
dans la langue cible, l'anglais par exemple? Ce sont les échanges entre trois savants qui 
vont faire avancer ce domaine : Shannon et Weaver, dont nous avons déjà parlé, et Norbert 
Wiener, le père de la cybernétique, cette science qui vise, dans l’après-guerre, à donner 
une vision unifiée de l'automatique, de l'électronique et de la théorie de l'information "". 
Comme on l'a dit, la traduction automatique peut être vue comme un processus d'encodage 
/ décodage. C'est ce que propose Weaver dés 1947, dans un échange avec Wiener : 


On peut naturellement se demander si le probléme de la traduction ne pourrait pas étre 
considéré comme un probléme de cryptographie. Quand je regarde un article en russe, je 
me dis : « Ceci a été écrit en anglais mais a été encodé avec des symboles étranges. Je vais 
maintenant procéder a son décodage. » 


Wiener est de son cóté extrémement prudent, et a sans doute de bonnes intuitions 
concernant la difficulté du processus. Il a bien conscience que les mots ne se correspondent 
pas directement d'une langue à l'autre et que le probléme de la traduction ne peut étre 
résolu aussi simplement : 


En ce qui concerne la traduction automatique, j'ai peur que les frontiéres des mots dans 
les différentes langues soient trop vagues [...] pour rendre l'idée d'un systéme quasi auto- 
matique de traduction possible. 


On voit bien, à travers les réserves de Wiener, la mise en évidence de problémes qui seront 
effectivement des obstacles majeurs pour la traduction automatique : les mots n'ont pas 
d'équivalents directs d'une langue à l'autre, il existe de nombreuses expressions figées 
ou idiomatiques qui ne peuvent pas se traduire littéralement, etc. 

Weaver poursuivra malgré tout ses travaux et rédigera en 1949 un court texte intitulé 
«Translation », mais plus connu sous le simple nom de Memorandum, qu’il fera circuler 
auprès de la communauté scientifique de l'époque. Weaver a en fait «une double casquette» : 
à côté de ses travaux scientifiques, celui-ci est aussi responsable de programmes de 
recherche pour les organismes scientifiques américains et doit déterminer les domaines 
scientifiques prometteurs qu'il faut financer. C'est ce qui explique le succés important de 
ce petit texte relativement informel : c'est à partir de ce Memorandum que la recherche en 
traduction automatique va démarrer, se structurer et se développer aux États-Unis. Dans 
son texte, Weaver n'ignore pas complétement les remarques et les réserves de Wiener, 
mais celles-ci sont tout de méme mises au second plan, alors qu'il s'agit de critiques 
fondamentales qui reviendront avec force 15 ans plus tard. 

Dans son Memorandum, Weaver met en avant quatre idées à explorer pour le traitement 
automatique des langues, et en particulier pour la traduction automatique. Ces quatre 
idées sont les suivantes : 

1. L'analyse du contexte d'apparition des mots doit permettre de déterminer leur sens. 

L'étendue du contexte à prendre en compte doit varier suivant la nature du mot mais 
aussi suivant le type et le sujet général du texte, si ces éléments sont connus. 


17. Surtoute cette période, outre les références déjà citées, voir les livres de référence de Hutchins (1986), 
Hutchins et Somers (1992) et Hutchins (2000). 
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2. Il doit étre possible de déterminer un ensemble de régles récursives qui permettent, 
à partir d'un nombre limité de telles régles, de générer l'ensemble des séquences 
linguistiques possibles. 

3. La traduction automatique peut s'inspirer des techniques développées en crypto- 
graphie. Weaver cite ici clairement le modéle de communication de Shannon. 

4. Les langues possédent des éléments universels qui peuvent permettre de faciliter le 
processus de traduction. Plutót que de traduire directement du chinois vers l'arabe ou 
du russe vers le portugais, il vaut probablement mieux chercher une représentation 
plus abstraite universelle qui éviterait les erreurs dues au mot à mot et à l'ambiguité. 

Il faut souligner comment, en quelques propositions rapidement décrites, Weaver couche 
sur le papier différentes idées qui n'ont cessé d’être explorées depuis. La première concerne 
la désambiguisation (déterminer la catégorie et le sens d'un mot suivant son contexte). 
Si l'analyse morphosyntaxique (déterminer si « danse» est un nom ou un verbe) est une 
tache bien maitrisée et pour laquelle la prise en compte du contexte immédiat est souvent 
suffisante, la tache de désambiguisation sémantique est, elle, beaucoup plus complexe et 
reste toujours mal maitrisée aujourd" hui. Nous y reviendrons dans la suite de cet exposé. 

Le deuxiéme point a fait la fortune des grammaires formelles, des années 1950 à nos 
jours. Il s'agit de décrire, au moyen d'un nombre de régles fini, l'infinité des réalisations 
possibles en langues (en particulier l'infinité des phrases possibles). Cette recherche sera 
notamment au cceur du programme chomskyen mais aussi de toutes les approches en 
analyse syntaxique automatique (parsing). 

Le troisiéme point fait le paralléle avec les techniques de cryptographie, qui avaient 
connu des développements fulgurants dans le contexte de la Seconde Guerre mondiale, 
comme on le sait. Si ce parallèle n'est plus vraiment d'actualité aujourd’hui, on peut tout de 
même remarquer que les techniques d'analyses statistiques les plus populaires aujourd’hui 
ont beaucoup en commun avec les techniques utilisées originellement en analyse du signal. 

Enfin, le dernier point va inspirer de trés nombreux travaux visant la recherche d'un 
nombre limité d'atomes sémantiques permettant de représenter des notions sémantiques 
plus complexes. Si ce type de recherche, pendant longtemps trés populaire, ne semble 
pas avoir donné de résultats trés probants, on voit apparaitre ces derniéres années de 
nouvelles représentations multilingues, qui ne visent plus la recherche d'atomes de sens, 
mais mettent en correspondance des mots de différentes langues selon un point de vue 
sémantique (réseaux sémantiques multilingues). 

Il faut enfin souligner la modestie du texte de Weaver, qui lance des idées mais souligne 
aussi leur probable naïveté («I have worried a good deal about the probable naivete of the 
ideas here presented»). Peut-étre faut-il ne voir là qu'une précaution rhétorique, mais on 
reste quand même frappé, à la lecture de ce texte, par la simplicité du propos qui contraste 
avec la postérité des idées mises en avant. Probablement y a-t-il quelque naiveté — ou en 
tout cas une grave sous-estimation des difficultés à venir — au sujet de l'ambiguité, qui se 
résume dans ce texte à un probléme pouvant étre résolu par l'analyse du contexte proche. 
Comme on l'a dit, cela est en partie vrai pour déterminer la nature des mots (leur catégorie 
morphosyntaxique), mais n'est en aucun cas suffisant pour déterminer leur sémantique. 


3.2. Les années 1950 : le premier áge d'or de la traduction automatique et le 
développement des systémes à base de régles 


Sous l'influence du Memorandum de Weaver et d'une douzaine de chercheurs en auto- 
matique, le domaine de la traduction automatique prend forme au début des années 1950 aux 
États-Unis. Quelques groupes recoivent des financements pour développer des recherches 
sur le sujet, d'abord de facon théorique le plus souvent car la période voit justement la 
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naissance des premiers ordinateurs. Comme on l'a déjà entrevu, deux éléments jouent 
un róle déterminant : d'une part, la cryptographie qui a connu des progrés fulgurants et 
dont la traduction automatique cherche à s’inspirer; d'autre part, sur le plan pratique, la 
traduction du russe vers l'anglais est un enjeu majeur, ce qui permet de mobiliser rapi- 
dement des financements pour le domaine. 

Mais c'est en fait un chercheur israélien qui va jouer un róle décisif. Yoshua Bar-Hillel 
effectue un séjour de deux ans au MIT, en 1951-1953, pour collaborer avec Carnap. Le 
philosophe d'origine allemande avait développé une «syntaxe logique du langage» qui 
ouvrait la voie à une formalisation logique des langues. Le rapport avec les ordinateurs 
naissants est alors évident : les recherches de Carnap semblaient pouvoir fournir une base 
solide au codage informatique de données exprimées en langue naturelle, autrement dit 
dresser un pont entre langues naturelles et langages artificiels. C'est ce que veut explorer 
Bar-Hillel, mais il n'en reste pas là. Une équipe du MIT s'intéresse à la traduction 
automatique, et naturellement Bar-Hillel s'y intéresse à son tour, la traduction étant très 
proche de ses centres d’intérêt concernant la formalisation et la mécanisation du langage. 
Bar-Hillel devient méme rapidement une figure essentielle du domaine. Il obtient une 
bourse lui permettant de visiter les principales équipes aux États-Unis, avec pour but 
d'organiser une conférence visant à réunir les principaux acteurs de ce domaine encore 
naissant. Bar-Hillel rédige alors un document montrant l'intérét de ces recherches, mais 
soulignant aussi les difficultés de la tache (ce document semble en quelque sorte faire 
écho à la discussion entre Wiener et Weaver qui avait eu lieu quelques mois plus tót). 
Dans la foulée, il organise la premiére conférence du domaine en juin 1952, au MIT. 

La plupart des chercheurs actifs en traduction automatique sont présents à la conférence 
du MIT. Les participants sont évidemment enthousiastes et soulignent le besoin d'attirer des 
financements importants, dans la mesure où la traduction demande des forces humaines, 
mais aussi et surtout l’accès à des ordinateurs qui ont un coût prohibitif à l'époque. Pour 
promouvoir la traduction automatique, le représentant de l'université de Georgetown 
(un des principaux centres de recherche, pionnier dans le domaine) propose qu'une 
démonstration soit organisée aussi tót que possible afin de démontrer la faisabilité du 
projet et d'attirer des subventions. 

L'année 1954 est ainsi marquée par la premiére démonstration de traduction automatique 
à partir d'un systéme mis au point conjointement par l'équipe de l'université de Georgetown 
et par IBM. Un ensemble de 49 phrases russes sont traduites vers l'anglais avec un 
système relativement sommaire (dictionnaire de 250 mots et 6 règles de grammaire 
seulement). L'impact est trés important et contribue à augmenter les financements pour 
la traduction automatique. L'événement a par ailleurs une large couverture médiatique, 
ce qui permet d'attirer la sympathie du public. Les agences de financement américaines 
soutiennent progressivement un nombre de groupes de plus en plus important sur la 
traduction automatique, principalement aux États-Unis, mais aussi au Royaume-Uni. La 
démonstration de 1954 attire aussi l'attention en URSS et plusieurs groupes de recherche 
soviétiques se lancent dans ce domaine de recherche à partir de 1955. Le domaine 
s'institutionnalise avec des conférences réguliéres et une revue spécialisée (Mechanical 
Translation, à partir de 1954). 

La plupart des groupes de recherche ont cependant alors un accès très limité aux 
ordinateurs, qui restent coüteux et peu répandus, notamment en URSS. De fait, la plupart 
des travaux demeurent théoriques et proposent des approches permettant de «mécaniser» le 
processus de traduction, sans étre toujours mis en ceuvre concrétement. Schématiquement, 
on peut dire que deux types de recherche voient le jour. Le premier est dit « pragmatique» 
et vise à produire rapidement des résultats, m&me si ceux-ci ne sont pas parfaits. Les 
systémes reposent alors essentiellement sur une approche de traduction directe : des 
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dictionnaires bilingues permettent d'obtenir une traduction mot a mot puis des regles de 
réordonnancement visent à produire un texte tenant compte de certaines particularités 
de la langue cible. Autrement dit, un dictionnaire permet de trouver des équivalences 
entre mots puis des régles simples permettent de contróler certains phénoménes locaux, 
comme l'ordre nom-adjectif. 

À l'inverse, un autre type de recherche concerne les partisans d'une approche plus 
théorique, qui vise à contourner les limites de l'approche directe. Diverses propositions 
se font alors jour pour intégrer une phase d'analyse du texte source dans le processus de 
traduction et procéder par des régles de transfert opérant au niveau syntaxique ou sémantique. 
C'est notamment dans les années 1950 que la notion de grammaire formelle se met en 
place, autour de Chomsky principalement. Certains centres de recherche s’intéressent 
aussi à la notion de langage pivot (où une langue particulière est utilisée comme mode de 
représentation intermédiaire entre langue source et langue cible) voire d'interlangue (où un 
langage artificiel est défini pour représenter les phrases à traduire) : l'approche consiste à 
encoder les informations nécessaires pour la traduction, indépendamment des langues visées. 


3.3. Les années 1960 : crise de la traduction automatique et naissance du traitement 
automatique des langues 


Après l'enthousiasme des années 1950, les années 1960 sont marquées par de nombreux 
doutes concernant la traduction automatique : les performances ne sont pas au rendez-vous 
(elles sont en tout cas trés loin des promesses proférées dans les années précédentes). Il 
y aen fait deux séries de critiques majeures : d'abord celles de Bar-Hillel dés la fin des 
années 1950 5, puis celles du rapport ALPAC (Automatic Language Processing Advisory 
Committee) en 1966. Ce dernier rapport est extrémement critique et contribuera à mettre 
les recherches en traduction automatique au second plan pour plusieurs décennies. 

Mais revenons à Bar-Hillel. Celui-ci a l'occasion de retourner aux États-Unis entre 
1958 et 1960. En se rendant en Amérique en 1958, il s'arréte à l'université de Namur 
pour donner une conférence intitulée « Some linguistic obstacles to machine translation ». 
Dans ce texte, Bar-Hillel énumère certaines questions linguistiques qui constituent à ses 
yeux des problèmes de fond pour la traduction automatique, dans la mesure où aucun 
systéme ne sait alors les résoudre. Pour lui, les modéles employés à l'époque sont trop 
simples et nécessiteraient d’être remplacés par des modèles rendant mieux compte de la 
structure des phrases à analyser. De plus, les régles de transfert entre langues génétiquement 
éloignées ne vont pas de soi et demandent probablement des formalismes complexes 
encore à inventer. À la suite de cette communication, Bar-Hillel se rend aux États-Unis 
pour évaluer les recherches dans le domaine. 

C'est dans ce cadre qu'il rédige un rapport technique intitulé « Report on the state of 
machine translation in the United States and Great Britain» (fév. 1959) pour le compte 
des autorités américaines, en l'occurrence le US Office of Naval Research. Le rapport 
dresse un constat extrémement négatif des travaux en cours, sans tenir compte du caractére 
trés récent des recherches observées (la plupart des groupes n'ont que quelques années 
d'existence). Tous les groupes de recherche sont directement cités et sévérement critiqués. 

Sur le plan linguistique, Bar-Hillel remarque d'une part que la traduction nécessite 
une analyse syntaxique complète du texte, ce qui n’était pas encore complètement évident 
pour tous les groupes impliqués dans le domaine à l'époque, et, d'autre part, que la 
traduction nécessite de résoudre les ambiguités sémantiques, ce qui est au-delà de l'état 
de l'art de l'époque et ne semble pas soluble à moyen terme. Une annexe du rapport a un 
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titre évocateur («4 demonstration of the non-feasibility of fully automatic, high quality 
translation») et entend montrer que le sens de certains mots ambigus ne peut étre déterminé 
automatiquement, méme en prenant en compte le contexte, ce qui suffit en soi à ruiner 
l'objectif d'une traduction automatique de qualité. Bar-Hillel prend l'exemple suivant, que 
nous citons car il demeure un des plus connus de l'histoire de la traduction automatique : 


Little John was looking for his toy box. Finally, he found it. The box was in the pen. John 
was very happy. 


Pour comprendre la phrase, il faut identifier le fait que «pen» désigne ici un parc oü 
l'enfant peut jouer, et en aucun cas un stylo ou un crayon. Or, rien dans le contexte ne 
permet d'inférer automatiquement ce sens pour «pen», qui est trés peu fréquent avec ce 
sens précis. C'est pourquoi tous les systémes sont incapables de résoudre ce type de cas, 
qui serait fréquent d’après Bar-Hillel. Il est donc impossible d'envisager une traduction 
complétement automatique de haute qualité à court ou moyen terme (Bar-Hillel parle de 
FAHQT : Fully Automatic High Quality Translation, on trouve parfois aussi l'acronyme 
FAHQMT : Fully Automatic High Quality Machine Translation). 

Le ton du rapport n'est cependant pas entiérement négatif. À la place de la traduction 
automatique, Bar-Hillel préconise de s'orienter vers des systémes de traduction assistée par 
ordinateur, ce qui constitue un projet relativement différent, et nettement moins excitant, 
scientifiquement parlant, que la conception d'un systéme entiérement automatique. 
Bar-Hillel plaide en particulier pour le développement d'aides à la traduction qui permettraient 
d'augmenter significativement la productivité des traducteurs en proposant des outils 
adaptés et efficaces, notamment au niveau de la pré — et de la postédition (préparation du 
texte pour la traduction; correction des erreurs de traduction). Dans la mesure ou il s'agit 
d'aider les traducteurs, les outils mis au point peuvent être relativement différents : par 
exemple, il vaut mieux présenter au traducteur des propositions de traductions plutót que 
produire directement un texte entier qui sera difficilement amendable (c'est ce qui existe 
aujourd’hui à travers les «mémoires de traduction», qui répondent justement à cet objectif). 

Les critiques de Bar-Hillel ont un effet assez net : de nombreux chercheurs arrétent 
leurs recherches en traduction automatique, sans pour autant abandonner complètement le 
traitement des langues par ordinateurs. Un constat est largement partagé, par Bar-Hillel mais 
aussi par l'ensemble des acteurs du domaine : il est nécessaire de se tourner vers l'analyse 
des langues, en commengant par des traitements bas niveau, pour refonder le domaine. 
La traduction automatique est trop ambitieuse et trop complexe : il faut avant tout établir des 
bases solides permettant une analyse syntaxique et sémantique adéquate, à partir de laquelle 
il sera éventuellement possible de concevoir ultérieurement des taches plus ambitieuses. 

Dans la foulée des discussions enclenchées à la suite du rapport de Bar-Hillel, les 
autorités américaines commandent en 1964 un rapport officiel sur l'état du domaine. 
Ce rapport sera rédigé par un comité ad hoc : le comité ALPAC. Le rapport s'intitule 
«Languages and machines: computers in translation and linguistics» et est finalement 
publié en 1966 !°. L'essentiel de ce court rapport concerne en fait les besoins en matière de 
traductions, l'utilité de celles-ci pour les agences concernées (il s'agit essentiellement du 
secteur public et d'entreprises liées à la sécurité et la défense; la plupart des traductions 
demandées n'avaient pas d’intérêt et étaient finalement peu ou pas lues) et les coûts liés 
à ces traductions. La partie sur la traduction automatique n'occupe en fait qu'un court 
chapitre de cinq pages au sein du rapport. 

La préface du rapport mentionne deux raisons qui pourraient justifier le financement 
de recherches par des fonds publics (à l'exception de la NSF, les agences finançant alors 
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la recherche dans le domaine aux Etats-Unis sont liées au monde de la défense et du 
renseignement ; il est courant aux États-Unis que ce type d'agences finance des recherches 
scientifiques mais il s'agit alors généralement de recherches sur objectif). Ces deux raisons 
seraient les suivantes : 1) il s'agit d'un programme de recherche fondamental, ambitieux, 
à long terme, avec des retombées potentiellement importantes ; 2) à l'inverse, la recherche 
vise à répondre à un probléme pratique. 

Le rapport indique que le cadre de la recherche en traduction automatique est clairement 
le deuxiéme (obtenir des méthodes rapides et efficaces à moindre coüt, à relativement 
court terme) et propose donc une évaluation du domaine à cette aune. Il s’agit là bien 
évidemment d'un biais important, dans la mesure ou l'absence de solution pratique efficace 
à court terme n'indique pas l'inutilité des recherches menées. La nature des agences 
finançant les recherches a sans aucun doute fortement influencé le processus d'évaluation. 

Les équipes payent aussi le prix de promesses trop importantes depuis les débuts 
de la recherche dans le domaine. La démonstration de 1954 (voir section précédente) 
laissait penser qu'une solution fonctionnelle était à portée de main. Or, les essais au 
niveau industriel et les démonstrations publiques de la fin des années 1950 et du début des 
années 1960 montrent qu'on en est loin. Cela est de fait contradictoire avec le discours 
ambiant quelques années plus tôt, où les équipes laissaient penser que la traduction 
automatique pourrait voir des résultats opérationnels en quelques mois. 

Il faut donc garder en téte que le rapport est avant tout tourné vers l'évaluation de la 
possibilité d'obtenir des traductions automatiques de haute qualité à court terme (FAHQMT, cf. 
supra). Cela donne au rapport une tournure particuliére et aura des conséquences importantes 
pour le domaine. Cela explique aussi pourquoi la première moitié du rapport détaille le 
volume de traduction traité dans les agences concernées, le nombre de traducteurs disponibles 
et les coüts induits. On le voit clairement à la lecture du rapport : on est dans la prise en 
compte d'une situation trés concrète et la principale mesure est l'évaluation des coûts! Les 
perspectives de recherche sont trés loin des préoccupations premiéres des auteurs du rapport. 

De fait, le rapport conclut qu'en termes de coût, un traducteur humain est plus abordable 
qu'une traduction automatique, pour un résultat meilleur et même plus rapide, dans la mesure où 
iln’y a pas besoin de postédition (la correction d'un texte traduit complètement automatiquement 
mais peu lisible est en soi un exercice souvent plus long que l'élaboration d'une traduction 
directe par un traducteur chevronné). Seule la traduction du russe vers l'anglais est considérée : 
là aussi, le rapport conclut que les besoins sont limités et que les plus gros «consommateurs » 
de traduction depuis le russe seraient plus avisés d'apprendre directement la langue qui les 
intéresse (le rapport semble d'ailleurs exagérément optimiste quant au temps nécessaire pour 
maîtriser une langue étrangère, évalué à quelques semaines seulement)! 

Le rapport indique donc nettement qu'il n'y a, au milieu des années 1960, aucun 
besoin en traduction automatique et que, d'un point de vue purement pratique, ce domaine 
ne présente aucun intérêt vu qu'il n'y a alors aucun système pertinent pour la tâche (la 
formulation originale est trés directe : «Il n'y a aucune urgence dans le domaine de la 
traduction. Le probléme n'est pas de satisfaire un besoin inexistant à travers des systémes 
de traduction automatiques inexistants. »). 

La suite aborde la question de la traduction automatique en elle-méme. Le rapport 
donne une définition standard de la traduction automatique, visant un processus entiérement 
automatisé, sans intervention humaine (« on présume que la traduction automatique signifie 
passer gráce à un algorithme d'un texte source sur un support lisible par ordinateur vers un 
texte cible sans recours à la traduction humaine ou à la postédition»). Le rapport conclut 
aussitôt qu'aucun système de ce type n'existe alors et qu'un tel système n'est même pas 
envisageable. Le systéme de Georgetown est alors explicitement cité : aprés huit années 
de financement, le systéme développé n'est toujours pas capable de fournir une traduction 
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correcte. Il faut intervenir au niveau de la postédition et ce travail est plus long que le temps 
consacré à la traduction directe par un traducteur humain. Le rapport souligne que si les 
traductions obtenues automatiquement produisent le plus souvent un texte déchiffrable, 
ils peuvent aussi contenir des faux-sens ou des contresens. Les nombreuses fautes qu'ils 
contiennent les rendent difficilement manipulables et pénibles à corriger. Le rapport livre 
alors, à titre d'exemple, quatre résultats de traduction depuis le russe par quatre systémes 
de traduction automatique récents. Ces traductions sont médiocres. 


3.4. 1965-1990 : comme une longue pause 


La période qui suit la publication du rapport ALPAC montre une pause des recherches en 
matiére de traduction automatique dans le monde anglo-saxon. D'autres pays continuent 
de financer des équipes de recherche tandis que les premiers systémes commerciaux font 
leur apparition. Les innovations techniques au cours de la période sont plus limitées, aprés 
le foisonnement de la première décennie. 

Le rapport ALPAC entérine l'asséchement des financements américains dans le domaine 
de la traduction automatique au milieu des années 1960. La réduction des financements 
était déjà patente depuis le réquisitoire de Bar-Hillel de 1959. Aux États-Unis, deux 
groupes continuent néanmoins les recherches sur la traduction automatique mais, même 
là, l'accent est mis sur l'analyse syntaxique en vue d'une approche par transfert. D'autres 
groupes abandonnent complétement la traduction automatique et se tournent eux aussi 
vers l'analyse syntaxique, ce qui constitue en quelque sorte un échec mais aussi une suite 
logique de la période précédente. 

D'autres pays, en particulier ceux oü plusieurs langues ont un statut officiel, lancent 
paradoxalement des centres de recherche sur la traduction automatique au moment ou les 
Etats-Unis abandonnent le domaine. Tel est le cas du Canada notamment, qui lance un 
centre de recherche a Montréal en 1965, alors que la plupart des centres américains ont 
déjà fermé (il s'agit du centre qui s'appellera à partir des années 1970 TAUM : Traduction 
automatique de l'Université de Montréal). Le besoin de produire un grand nombre de 
documents officiels en anglais et en frangais entraine des frais de traduction élevés, ce qui 
constitue un élément incitateur fort pour lancer des recherches dans le domaine. Le groupe 
de Montréal sera à l'origine du systéme qui a longtemps été le plus connu dans le domaine 
de la traduction automatique : il s'agit de TAUM Météo, chargé de traduire les bulletins 
météorologiques de l'anglais vers le français et du français vers l'anglais, de manière 
entiérement automatique ou trés faiblement supervisée. Des milliers de rapports seront 
ainsi traduits, au niveau national et au niveau régional, pour chaque province du Canada. 

En France, la recherche débute avec l'arrivée des premiers ordinateurs vers la fin des 
années 1950”°. Deux groupes de recherche sur la traduction se mettent alors en place : 
le GETAP à Paris et le GETAG à Grenoble (GETA : Groupe d'étude sur la traduction 
automatique, P signifiant Paris et G, Grenoble). Le GETAP disparait rapidement : c'est un 
chercheur francais en automatique, formé à Polytechnique et passé au MIT, Maurice Gross, 
qui en est responsable. M. Gross arrive rapidement aux mémes conclusions que Bar-Hillel : 
la traduction automatique est une tache trop complexe pour étre abordée directement, il 
faut d'abord assurer des bases solides au traitement automatique des langues. L'originalité 
de Maurice Gross consiste à ne pas se tourner vers l'analyse syntaxique, contrairement à la 
plupart de ses homologues américains : il a l’intuition qu'au-delà des grands principes sur 
la langue, c'est au niveau du lexique que réside l'essentiel de l'information nécessaire pour 
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l'analyser. Il se tourne alors vers un programme de travail qui l’occupera plus de 30 ans, 
l'élaboration d'un objet dit «lexique-grammaire » qui, comme son nom l'indique, vise à 
encoder une part de la grammaire au niveau du lexique (par exemple, le fait qu'un verbe 
puisse se mettre au passif, le fait que le complément d'agent d'un verbe comme «aimer» 
au passif est introduit par «de» et non par la préposition « par», etc.). Ce programme de 
travail est à l'opposé de celui de Chomsky, par exemple, qui, au méme moment, cherche à 
décrire des principes généraux et méme universels sur la langue. Le lexique est souvent vu 
comme le royaume de l'arbitraire, chaque fait devant étre enregistré sans qu'il soit réellement 
explicable sinon par le hasard des circonstances : Gross montre qu'il n'en est rien et qu'il 
est possible de décrire le lexique à travers des classes de mots partageant des ensembles de 
propriétés qui peuvent être définies explicitement. Il défend aussi l’idée que la description 
du lexique est une táche nécessaire, et qu'aucun systéme ne pourra fonctionner sans lexique 
riche à large couverture. De fait, dans les années 1970 et 1980, la France aura une avance 
importante en matière de lexiques électroniques, avant que les Américains ne décident eux 
aussi de lancer de grands programmes dans ce domaine dans les années 1980. Le lexique- 
grammaire est toujours disponible, mais son format est lourd et peu adapté aux traitements 
automatiques mis en œuvre aujourd’hui. Il a été repris et intégré dans d'autres lexiques 
mais n'a pas vraiment survécu à la disparition de son concepteur au début des années 2000. 
L'équipe de Grenoble deviendra le GETA (sans le G final) aprés la disparition du 
centre parisien. Ce centre, dirigé par Bernard Vauquois, un chercheur formé en 
mathématiques et astrophysique, met au point dans les années 1960 un systéme de traduction 
original. Les relations syntaxiques y sont encodées dans un formalisme logique indépendant 
des langues. Les recherches portent alors surtout sur la traduction de textes de mathématiques 
et de physique du russe vers le français. Le système souffre toutefois d'un manque de 
flexibilité : un probléme à un niveau suffit à bloquer tout le processus de traduction. 
Vauquois se lance alors, au milieu des années 1970, dans le développement d'un systéme 
modulaire, avec des possibilités de transfert à différents niveaux (ce sera le système 
Ariane-78). Bernard Vauquois est aussi l'auteur d'un célébre schéma : le triangle de la 
traduction (figure 3) qui résume les différentes approches possibles dans le domaine. 


interlangue 


transfert 
sémantique 


transfert 
syntaxique 


texte transfert direct teste 


source cible 


Figure 3. Le triangle de Vauquois?!. 


Pour Vauquois, la traduction idéale nécessiterait une représentation logique et indépen- 
dante des langues (le sommet du triangle) mais, si le systéme ne peut pas atteindre cette 
finesse d'analyse, des niveaux de transfert intermédiaire syntaxique ou sémantique peuvent 
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permettre de proposer une traduction au moins partielle. Le niveau inférieur (transfert 
direct) correspond en fait à une traduction mot à mot (traduction directe au niveau des 
mots et réordonnancement local éventuel, sans analyse syntaxique globale). 

De la méme maniére que le bilinguisme ambiant a poussé le Canada à financer un 
centre de recherches alors que les États-Unis se détournaient de la traduction automatique, 
la nécessité de produire des traductions entre un nombre important et réguliérement 
grandissant de langues au sein de l'Union européenne pousse la Commission européenne 
à s'intéresser à la traduction automatique dans les années 1970. Deux faits marquants sont 
à relever : l'Union européenne examine d'abord les principaux systémes commerciaux 
disponibles. C'est ainsi qu'une entreprise née aux États-Unis en 1968, Systran, sera amenée 
à faire une démonstration de son systéme en 1975, avant de développer un prototype 
intégrant les différentes langues de l'Union européenne puis de nouer un partenariat 
prolongé au cours des années 1980. Parallélement, à la fin des années 1970 et largement 
sous l'impulsion de Vauquois, un grand programme de recherche européen est lancé. 
Il s’agit du projet Eurotra qui sera actif de 1978 à 1992. L’accent est mis sur le niveau 
syntaxique, davantage que sur le développement de lexiques bilingues. Les ambitions 
du projet, qui devait initialement aboutir à des systèmes opérationnels entre les langues 
de l'Europe, sont progressivement réduites et ses retombées seront finalement modestes, 
contribuant essentiellement à faire émerger et à fédérer des groupes de recherche en 
traitement automatique des langues à travers l’Europe. 

Ailleurs dans le monde, en Union soviétique et en Asie notamment (Chine, Japon), 
plusieurs centres sont créés ou poursuivent leurs recherches au cours de la période. 
L'apparition de corpus parallèles (c'est-à-dire d'ensembles de textes en situation de 
traduction) va progressivement amener les chercheurs à imaginer de nouvelles méthodes 
pour la traduction automatique, ce qui aura pour conséquence de relancer la recherche et 
de renouveler les méthodes exploitées dans le domaine. 


3.5. 1990-2015 : l'avénement des statistiques ou le deuxiéme áge d'or dela traduction 
automatique 


La traduction automatique statistique voit le jour à la fin des années 1980 quand une équipe 
d'IBM essaie d'appliquer à un probléme de traduction des techniques issues de la reconnais- 
sance de la parole’. Dans ce dernier domaine, la tâche consiste à produire une séquence de 
mots à partir d'un signal sonore. La traduction automatique pose un probléme en quelque 
sorte similaire, dans la mesure où il s’agit de produire une séquence de mots dans une langue 
cible à partir d'une séquence dans une langue source (autrement dit, il suffit de substituer 
la notion de langue source au signal sonore de la reconnaissance de la parole). 

La traduction automatique statistique repose sur la disponibilité de grands corpus 
bilingues alignés, c'est-à-dire de trés grands ensembles de textes en situation de traduction 
«fidèle » où chaque phrase de la langue source est alignée avec une phrase de la langue 
cible (plus rarement, on peut avoir affaire à des alignements asymétriques, où une phrase 
de la langue source doit étre alignée avec deux phrases de la langue cible par exemple). 
L'approche statistique revient à repérer les cooccurrences les plus fréquentes entre langue 
source et langue cible et à en inférer des traductions potentielles au niveau des mots”. 

Schématiquement, chaque alignement et chaque correspondance lexicale a au début la 
méme probabilité, mais l'observation que deux mots apparaissent régulièrement en regard 
l'un de l'autre dans un trés grand nombre de phrases va progressivement renforcer leur 
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probabilité d'étre la traduction l'un de l'autre, ainsi que la probabilité des alignements 
possibles au niveau des phrases oü ces deux mots sont en correspondance. Cette stratégie 
revient en quelque sorte à effectuer une traduction mot à mot, à partir de la recherche 
préalable de correspondances lexicales dans de trés grands corpus. Le modèle peut aussi 
étre complexifié pour tenir compte de séquences : un des grands enjeux de la recherche 
dans les années 2000 consistera justement à étendre les modèles IBM originaux pour tenir 
compte de « fenétres de traduction» plus longues et à fonder l'analyse sur des séquences 
de textes (de n mots contigus pris ensemble par exemple), ce qui augmente beaucoup la 
qualité des traductions produites ?*. 

Il n'empéche, cette approche semble à l'opposé des recommandations des rapports 
des années 1960, à savoir que pour traduire un texte il faut d'abord le comprendre, 
c’est-à-dire en donner une représentation syntaxico-sémantique explicite. Les modèles 
IBM vont cependant connaître un succès phénoménal, au-delà des attentes de l’équipe 
IBM elle-même, qui ne voyait là initialement que l’occasion d’une expérience simple 
et basique. L'intégration de connaissances extérieures plus complexes (dictionnaires 
ou réseaux sémantiques par exemple) finira par se faire, mais pendant longtemps les 
principales extensions de ces modèles porteront sur les aspects statistiques. 

Pourquoi ces systémes semblent-ils obtenir des performances acceptables sur des textes 
variés, en tout cas souvent meilleurs que les systémes à base de régles mis au point par 
de nombreux linguistes pendant plusieurs années? Un apercu de la réponse se trouvait 
en filigrane dans les pages précédentes : il est quasi impossible à des linguistes de définir 
des règles d'analyse ou de transfert à large couverture, tenant compte du contexte, pour 
un domaine ouvert. À l'inverse, les systémes statistiques peuvent analyser des corpus de 
plusieurs millions (voire aujourd'hui milliards) de mots, en tirer des informations dépendant 
du contexte local (souvent limité à une fenétre de trois ou quatre mots autour du mot 
analysé), ce qui suffit à élaborer des systémes plus robustes et souvent plus exacts que des 
systèmes développés manuellement. Notons, en outre, qu'on ne cherche pas obligatoirement 
une traduction exacte quand on est sur Internet : une traduction vague donnant une idée 
du contenu du document original peut parfois étre une aide précieuse (par exemple pour 
décider de demander une traduction plus exacte à un traducteur professionnel). 

Les approches statistiques ne sont pas limitées au domaine de la traduction automatique : 
C'est en fait à tout le traitement automatique des langues que les approches statistiques 
vont s'imposer. Par exemple, l'outil le plus populaire depuis une vingtaine d'années 
pour l'analyse morphosyntaxique (annotation en parties du discours et lemmatisation) 
est TreeTagger ?, un outil conçu au début des années 1990. TreeTagger a été adapté 
pour des dizaines de langues mais la base statistique reste la méme. Dans le domaine de 
l'analyse syntaxique aussi les approches statistiques se sont rapidement révélées les plus 
efficaces : elles permettent de prendre des décisions locales en fonction d'un nombre 
important d'informations de nature variée. 

Simultanément, la période voit l’avènement des campagnes d'évaluation : à partir du 
moment où de nombreux systèmes peuvent être mis au point rapidement à partir des données 
disponibles sur le Web, il est important de pouvoir évaluer ces systèmes, pour les comparer 
et pour voir quelles sont les approches les plus efficaces ?*. Les campagnes d'évaluation 
permettent aussi aux financeurs d'avoir une idée des performances possibles et surtout 
elles permettent aux chercheurs de surveiller les avancées d'un domaine (les recherches 
progressent-elles ou ont-elles atteint un plateau ?). Partant, à partir des années 1990, des 


24. Koehn (2009). 
25. http : //www.cis.uni-muenchen.de/-schmid/tools/TreeTagger/. 
26. Paroubek et al. (2007). 
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centaines de campagnes d'évaluation vont étre organisées, d'abord dans le domaine de 
l'extraction et de la recherche d'information (campagnes TREC, Text Retrieval Conference, 
et MUC, Message Understanding Conference), et plus récemment dans des domaines 
moins appliqués comme la sémantique (SemEval, Semantic Evaluation ; ACE, Automatic 
Content Extraction). D'autres sont propres au domaine de la traduction automatique : 
chaque année, différents couples de langues sont proposés; il peut s'agir de langues indo- 
européennes ou, de plus en plus, de langues moins explorées jusqu'ici (sur l'évaluation 
en TAL, voir la section 5). Le développement de systémes pour des langues plus rares, 
ou ayant un potentiel commercial moins fort, reste une préoccupation importante. 


3.6. Depuis le milieu des années 2010 : la révolution de l'apprentissage profond 


On a vu, dans la section qui précède, l'avantage des méthodes statistiques, notamment 
en matiére de traduction automatique. La traduction statistique souffre toutefois de 
problémes connus et difficiles à surmonter. En particulier, une des faiblesses majeures des 
systémes fonctionnant sur cette base est de devoir composer la traduction d'une phrase 
par assemblage de fragments de textes trouvés dans la langue cible. Or ces fragments 
peuvent étre hétéroclites et ne sont pas toujours compatibles entre eux : il y a dés lors 
un fort risque d'obtenir des phrases bancales, voire incohérentes. Si les systémes se sont 
considérablement améliorés depuis les années 1990, les phrases restent toutefois souvent 
mal traduites, surtout si elles sont longues. 

Par ailleurs, on observe que le Web est un objet de plus en plus multilingue. Ainsi, 
la part des utilisateurs d'Internet dont la langue maternelle est l'anglais serait passée 
aux alentours de 25 % récemment, alors que largement plus de 50 96 d'entre eux étaient 
anglophones aux débuts du Web (voire 100 % au tout début). Les besoins en matière 
de traduction automatique sont donc avérés et le marché incite à poursuivre l'effort en 
faveur d'une traduction de meilleure qualité. 

Alors que les systémes de traduction automatique statistique s'amélioraient 
réguliérement, un changement majeur est survenu ces derniéres années. Il s'agit, comme 
on peut s'en douter, de l'arrivée de l'apprentissage profond, c'est-à-dire des réseaux de 
neurones artificiels 7’. Un neurone artificiel est un programme informatique qui produit un 
résultat à partir de différentes valeurs fournies en entrée. Un réseau de neurones prend des 
décisions, c'est-à-dire produit un résultat, en fonction d'un trés grand nombre de neurones 
organisés de facon hiérarchique. La modélisation sous forme de réseau permet de tenir 
compte d'un trés grand nombre de variables organisées semi-automatiquement, qu'il serait 
impossible de classer et de hiérarchiser manuellement. Les liens d'un neurone avec chacun 
des autres neurones du réseau ne sont pas équiprobables mais sont «appris», c'est-à-dire 
qu'une multitude d'exemples doivent étre présentés au réseau afin que celui-ci ajuste ses 
paramètres pour prendre la «meilleure» décision en fonction d'une situation donnée. Un 
réseau de neurones est donc un modèle complexe qu'il est difficile d'expliquer de facon 
simple, mais on peut prendre l'exemple d'un systéme devant déterminer le sujet du verbe 
au sein d'une phrase simple. Par défaut, si on ne donne aucune information au systéme, 
tous les mots d'une phrase donnée peuvent étre considérés comme des sujets potentiels 
mais, par simple observation des régularités dans le corpus d'apprentissage, le systéme peut 
rapidement identifier que seuls les noms et les pronoms ont de bonnes chances d'étre sujet 
(d'autres cas sont possibles — des infinitifs peuvent aussi étre sujet par exemple — mais il 
y a des chances pour que ces cas soient ignorés s'ils sont trop rares). Jusque-là, les choses 
sont relativement triviales, mais déterminer quel est le nom qui est réellement le sujet 
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d'une phrase donnée est complexe — il faut évidemment pouvoir prendre en compte les 
cas de sujet inversé — et dépend d'une multitude de facteurs ayant trait à la structure des 
groupes nominaux, à la structure de la phrase, aux régles d'accord, etc. La modélisation 
de tels phénomènes est complexe et nécessite l'observation de multiples exemples, et 
méme un observateur attentif est rapidement confronté à des régles relatives, difficiles à 
ordonner et parfois contradictoires. Le réseau de neurones permet souvent de résoudre 
ce type de problèmes de manière plus satisfaisante et entièrement automatique. Il n'y a 
plus de régles à proprement parler, mais un systéme capable de prendre des décisions en 
fonction d'un réseau complexe et hiérarchisé de contraintes pondérées. 

L'approche neuronale a aussi un grand avantage sur l'approche statistique classique : 
elle permet de considérer la phrase en entier, d'un coup, ce qui évite la phase hasardeuse 
d'assemblage des fragments épars de traduction. La principale nouveauté est de procéder 
par une analyse contextuelle globale, c'est-à-dire qu'à tous les niveaux d'analyse, le sens 
des mots est représenté par leur entourage, puis les mots sont regroupés en ensembles 
plus larges sémantiquement homogènes appelés «plongements de mots» (ou «word 
embedding» en anglais). L'avantage de cette technique est d'améliorer notablement la 
notion de contexte en prenant en compte non seulement le contexte du mot considéré, 
mais aussi celui des mots les plus proches sémantiquement, ce qui permet de mieux tenir 
compte des mots rares par exemple. L'analyse de la phrase est hiérarchique : pour chaque 
niveau (mot, groupe de mots, puis phrase complete) une représentation riche, contextuelle 
et dynamique est à l’œuvre (riche car un trés grand nombre d'informations de natures très 
diverses est pris en considération; dynamique et contextuelle car le contexte à prendre 
en considération change dynamiquement pour chaque unité linguistique à analyser). Un 
aspect intéressant de cette approche est que le systéme, en découvrant progressivement 
des régularités de facon incrémentale, identifie des groupes de mots linguistiquement liés 
entre eux. Autrement dit, sans que la syntaxe — c'est-à-dire les relations entre les mots — soit 
directement et explicitement formalisée, le système la reconstitue de lui-même en partie. 

Au-delà des performances, certaines caractéristiques de cette approche entrent en résonance 
avec les sciences cognitives, ce qui contribue aussi à sa popularité. Les mots, tout comme les 
syntagmes ou les phrases, peuvent étre directement comparés selon leur degré de similarité, 
sur une échelle relative. Cette méthode permet d'identifier des synonymes ou des antonymes 
au sein d'une langue, mais aussi des équivalents traductionnels, si la méthode est appliquée 
à un couple de langues. Comme avec les méthodes statistiques classiques, c'est en fait un 
ensemble de mots dans la langue cible qui pourra étre extrait comme traduction possible d'un 
mot donné dans la langue source, chaque mot étant «plus ou moins probable» en fonction 
du contexte. Enfin, comme la méthode prend aussi en compte des groupes de mots (et pas 
seulement des mots simples), des contraintes de nature syntaxique sont aussi captées par cette 
méthode d'analyse, même si la syntaxe n’y est pas explicitement encodée. 

On est ici trés loin, voire à l'opposé des approches manuelles en vogue au début de 
la traduction automatique. L'approche par apprentissage profond peut dés lors susciter 
des discussions sur ses rapports avec l'apprentissage humain. Mais l'analogie a aussi 
ses limites. Ainsi, les systémes ont encore besoin d'infiniment plus de données qu'un 
humain pour inférer des connaissances, ce qui pose probléme pour les langues moins 
bien représentées sur Internet par exemple. Les systémes d'apprentissage sont aussi 
complétement déconnectés du monde réel et n'ont aucune connaissance de sens commun 
par exemple, alors que ce serait utile pour traiter certaines ambiguités par exemple. 

L'approche neuronale s'est généralisée en quelques mois à l'ensemble des grands 
acteurs de la traduction automatique. Le mouvement a été particuliérement frappant à 
l'automne 2016, quand Google a proclamé avoir remplacé son systéme de traduction 
automatique fondé sur l'approche statistique par un modèle par apprentissage profond, 
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avec une amélioration immédiate et trés visible des résultats. A sa suite, tous les grands 
acteurs du domaine ont annoncé leur passage à l'apprentissage profond. Le contraste a 
été assez saisissant avec ce qui s'était passé 25 ans plus tót, quand l'approche statistique 
avait mis plusieurs années à s'imposer. Dans les années 1990, certains acteurs du domaine 
opposaient statistiques et sémantique. En 2016, nul débat de ce type : l'amélioration 
du systéme de Google a été nette (au moins pour certains couples de langues comme 
français-anglais) et la popularité de l'apprentissage profond dans d'autres domaines 
(du jeu de go à la vision artificielle) a fait le reste. 

Tous les problémes de la traduction automatique ne sont pas résolus pour autant. Certains 
sont des problémes classiques, comme celui du traitement des mots «inconnus» (c'est-à- 
dire inconnus du système). La gestion des mots inconnus est un probléme banal, courant 
mais toujours mal résolu et pour lequel chaque équipe met au point des «remèdes » plus 
ou moins efficaces (translittération ou copie directe si le mot a des chances d’étre un nom 
propre, analyse de la structure du mot si elle est possible; en pratique le mot est souvent 
juste copié ou «omis» dans la langue cible, faute de traitement adéquat). 

Plus fondamentalement, comme pour les approches statistiques, l'apprentissage profond 
nécessite toujours beaucoup de données (des corpus paralléles de plusieurs millions de 
mots). Il est donc douteux que l’on dispose jamais (ou en tout cas pas dans un futur proche) 
de corpus bilingues suffisants pour développer des systèmes efficaces, au-delà d'un cercle 
restreint d'une dizaine ou d'une quinzaine de langues bien représentées sur Internet. Cela 
est manifeste quand on s'intéresse à la qualité des traductions produites : celles-ci sont 
relativement bonnes entre le français et l'anglais, mais beaucoup moins pour d'autres couples 
de langues. À titre illustratif, les traductions de l'arabe ou du chinois, bien qu'elles aient 
donné lieu à de trés nombreuses recherches, restent encore souvent défaillantes. 

Au-delà de la masse de données disponibles, différents facteurs expliquent la grande 
variation de la qualité des traductions obtenues. La traduction vers l'anglais est plus aisée 
que vers d'autres langues car l'anglais isole les mots et a une morphologie particuliérement 
pauvre. Autrement dit, les mots varient peu en anglais : le genre, le nombre, voire le 
temps verbal sont à peine marqués, alors que d'autres langues tels l'allemand ou le russe 
agrègent beaucoup d'informations sur le mot (sans parler des langues non indo-européennes 
qui sont souvent encore beaucoup plus complexes de ce point de vue). Par conséquent, 
pour traduire en allemand ou en russe, il faut d'abord procéder à une analyse syntaxique 
pour déterminer la fonction du mot dans la phrase, puis son cas et sa forme précise, telle 
qu'on la trouve dans les textes. Ce type d'analyse est complexe, et il faut ajouter que 
les systémes passent encore fréquemment par l'anglais, utilisé comme une langue pivot, 
pour traduire (quand la source ou la cible n'est pas l'anglais), rajoutant autant d'erreurs 
potentielles. Toutefois, les grands acteurs eux-mémes en sont encore là puisqu'ils ont 
observé qu'une double traduction passant par l'anglais donnait malgré tout de meilleurs 
résultats qu'une traduction directe entre les deux langues concernées. 

Enfin, la structure et la proximité linguistiques des langues ont aussi une influence 
majeure. La traduction entre langues indo-européennes, méme parfois avec relativement 
peu de données disponibles, fonctionne mieux que la traduction vers le chinois ou l'arabe, 
car ces langues ont une structure et des principes linguistiques trés différents de ceux 
de l'anglais. Une question intéressante est alors de savoir Jusqu'oü les approches à base 
d'apprentissage sur de grands corpus paralléles peuvent étre améliorées ou, autrement 
dit, s'il y a des limites fondamentales et inhérentes à cette approche, qui exigeraient 
un retour de la linguistique dans l'affaire. On notera enfin des recherches, menées 
actuellement, pour produire des systémes multilingues, c'est-à-dire des systémes capables 
d'analyser simultanément plusieurs langues, au niveau syntaxique par exemple. De facon 
complémentaire, dans le domaine de la traduction automatique, des expérimentations 
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sont en cours pour développer des systémes capables de traduire sans corpus bilingues. 
Il s'agit de recherches trés techniques, qui sont prometteuses dans la mesure oü elles 
permettraient de développer des systémes efficaces pour des «langues rares», pour 
lesquelles il n'existe pas de corpus parallele. 


4. LA RECHERCHE EN TRAITEMENT AUTOMATIQUE DES LANGUES AUJOURD?HUI 


Le traitement des langues est un domaine extrémement divers et il est impossible d'en faire 
un inventaire détaillé tant la tache serait vaste. Il serait tout aussi illusoire d'entreprendre 
de faire une séparation entre recherche fondamentale et recherche appliquée car une telle 
frontiére n'existe pas. Comme il est fréquent dans le secteur dit des «nouvelles techno- 
logies», les produits et les applications qui naissent chaque jour incluent tous une part de 
recherche. Dans le méme temps, le TAL est par nature toujours appliqué à des langues et des 
textes particuliers, il n’y a donc pas vraiment de sens à parler de recherche «fondamentale». 

Il est pourtant nécessaire de définir des sous-domaines de recherche afin de dresser une 
géographie du domaine du TAL et d'aider le lecteur à se repérer. C'est donc fort des précautions 
rappelées ici qu'on lira les pages qui suivent. On abordera dans cette partie la recherche en TAL 
aujourd’hui, avant d'en venir dans la section suivante aux applications du TAL, sachant, encore 
une fois, que les applications impliquent et incluent des résultats issus de recherches récentes. 

Un regard rapide sur le domaine pourrait laisser croire que la recherche en TAL 
est aujourd’hui uniquement l'apanage des informaticiens, et plus spécifiquement des 
spécialistes de l'apprentissage artificiel, voire des réseaux neurones. Cette observation 
n'est pas sans fondement : le TAL est devenu trés étroitement lié à l'apprentissage artificiel 
et le domaine refléte l'évolution des techniques d'apprentissage, d'oü certains effets de 
mode. Les chaines de Markov? ont été supplantées par les conditional random fields ?, 
puis ce sont les support vector machines ? qui ont connu un immense succès, et c'est 
le deep learning (V apprentissage profond, à base de réseaux de neurones) qui domine 
aujourd'hui. Au-delà des effets de mode, il faut souligner que cette évolution répond 
à une certaine logique et que ces méthodes ont graduellement permis de résoudre des 
problémes de plus en plus complexes. Par exemple, la traduction automatique neuronale 
fonctionne aujourd’hui au niveau de la phrase prise dans sa globalité, ce qui est évidemment 
un avantage énorme par rapport aux méthodes antérieures qui essayaient de produire 
des traductions à partir de fragments de textes parfois disparates. C'est d'ailleurs cette 
évolution qui a éloigné le TAL de la linguistique et l'a rapproché de l'apprentissage 
artificiel : les systémes s'améliorent réguliérement et l'apprentissage a su se renouveler 


28. Formalisme qui permet de prédire un événement futur en fonction du passé; en TAL, on utilise 
les chaines de Markov pour prédire l'étiquette morphosyntaxique d'un mot m en fonction des 
étiquettes morphosyntaxiques des quelques mots qui précédent. Ce type de formalisme est bien 
adapté pour traiter un texte vu comme une séquence d'éléments (une séquence linéaire de mots ou 
d'étiquettes). Sur ce point et concernant aussi les notes suivantes, voir Gilleron (2019). 


29. Modèle inspiré des chaines de Markov, mais pouvant prendre une décision sur la base d'informations 
plus diverses : sont considérés non seulement les étiquettes, mais aussi les mots eux-mêmes ainsi 
que des liens complexes entre les mots. Ces liens peuvent représenter des éléments de structure, ce 
qui permet de s'affranchir partiellement de la notion de séquence de mots. 


30. Un SVM est un classifieur binaire (c'est-à-dire un systéme renvoyant une valeur 0 ou 1) en 
fonction d'un trés grand nombre de paramètres. Les SVM permettent d'encoder toute sorte de 
relations, et donc de structures, indépendamment de l'ordre linéaire des mots dans la phrase. On 
peut combiner plusieurs SVM pour obtenir un systéme puissant, qui ne soit plus simplement 
binaire (et il faut noter que tout probléme peut étre reformulé comme un probléme de prise de 
décision : par exemple, un classifieur binaire peut dire si la relation entre deux mots est de type 
sujet-verbe ou non, etc., ce qui peut permettre de décrire un analyseur syntaxique complet). 
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et se transformer pour régulièrement répondre aux limites des approches précédentes. 
On peut observer que le «plateau de performances» — le moment ou les performances 
des systémes d'apprentissage vont stagner —, étape qui exigerait un retour des linguistes 
pour résoudre les problémes de linguistique « pure », n'est toujours pas à l'ordre du jour. 

Cela ne veut pas dire que la linguistique n'a plus rien à voir avec le TAL, au-delà du róle 
ingrat de « fournisseur de corpus annotés ». On peut au contraire voir plusieurs points de 
convergence possibles : le premier consiste à essayer de comprendre pourquoi les systémes 
récents fonctionnent relativement correctement (suivant la langue, la táche et le degré de 
performance exigé). On ne sait finalement que peu de choses sur les représentations internes 
manipulées par les réseaux de neurones et on peut imaginer qu'une meilleure connaissance 
de ces modèles aiderait d'une part à mieux comprendre comment ils fonctionnent, mais 
aussi, d'autre part, à mieux appréhender le fonctionnement du langage lui-méme. Les 
réseaux de neurones, malgré leur nom, n'ont probablement rien à voir avec la façon dont 
fonctionnent le cerveau et les neurones «naturels», mais ils peuvent malgré tout fournir 
des informations précieuses, par exemple pour déterminer quelles sont les informations 
importantes, en interaction, pour résoudre tel probléme particulier. Il reste, au-delà, une 
multitude de problémes à l'intersection du TAL et de la linguistique, pour lesquels une 
interaction entre spécialistes des deux domaines serait utile, que ce soit en acquisition 
du langage, en linguistique historique ou en psycholinguistique. 

On commencera donc cet exposé en examinant différents domaines traditionnels du 
TAL et de la linguistique, à savoir la morphosyntaxe, la syntaxe et la sémantique, avant 
d'en venir à ces sous-domaines plus particuliers que nous venons d'évoquer, et où l'on 
voit un véritable échange avec le TAL. 


4.1. Phonétique 


La phonétique n'est pas absente du TAL, mais elle est trés liée à l'analyse du signal et à 
l'analyse de la parole, des domaines que nous avons fait le choix de ne pas traiter ici car 
l'analyse linguistique y est extrémement réduite. Nous n'en dirons donc pas plus et renvoyons 
le lecteur à des ouvrages plus spécialisés en analyse du signal et de la parole par exemple ?!. 


4.2. Analyse morphosyntaxique 


Pour le TAL, la morphosyntaxe correspond avant tout à la désambiguisation des mots en 
contexte, afin de déterminer leur catégorie morphosyntaxique et, éventuellement, d'autres 
traits de nature morphologique. La difficulté de la tache provient du fait que les mots 
sont ambigus («sinistre » peut ainsi étre un nom, un adjectif ou un verbe, «le» peut étre 
un déterminant ou un pronom, etc.) : les mots doivent étre désambiguisés en fonction 
du contexte, mais le contexte d'un mot est constitué d'autres mots qui risquent d’être 
eux-mémes ambigus. Il faut toutefois noter que globalement, il existe peu de phrases par 
nature ambigués (en dehors des exemples classiques des livres de linguistique, comme 
«Le boucher sale la tranche», oü la phrase peut avoir deux sens différents, suivant qu'on 
analyse sale comme un verbe ou comme un adjectif). 

Du fait de l'interdépendance des décisions à prendre pour désambiguiser les mots, la 
táche est particuliérement difficile pour un humain. Il est beaucoup plus efficace de laisser 
la machine déterminer la bonne étiquette, et méme des modèles relativement simples se 
révèlent très performants ?. En pratique, la catégorie d'un mot peut souvent être déterminée 


31. Voir Mariani (2002) pour une bonne synthèse en français. 
32. Voir Poudat et Landragin (2017), en particulier le chapitre 2. 
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en fonction de la catégorie des quelques mots qui le précédent, la taille du contexte à 
prendre en compte variant en fonction du mot a désambiguiser (souvent les deux mots 
précédents peuvent suffire a prédire avec une assez bonne fiabilité la catégorie du mot 
suivant, étant donné qu'il s'agit de faire un choix parmi un ensemble de catégories 
répertoriées dans un dictionnaire). 


Cette PRO:DEM ce 

situation NOM situation 

met VER:pres mettre 

en PRP en 

évidence NOM évidence 

le DET:ART le 

caractère NOM caractère 

incontournable ADJ incontournable 

de PRP de 

la DET:ART le 

place NOM place 

du PRP:det du 

travail NOM travail 

dans PRP dans 

un DET:ART un 

pays NOM pays 

industriel ADJ industriel 
SENT 


Figure 4. Un texte analysé par un analyseur morphosyntaxique ?. 


La figure 4 donne un exemple de phrase analysée morphosyntaxiquement. Chaque mot de la 
phrase est placé sur une ligne particulière, le mot est suivi d’une étiquette morphosyntaxique 
(PRO : DEM: pronom démonstratif; NOM : nom, etc.) et de son lemme. On voit que l'ana- 
lyse n'est pas exempte d'erreurs (ainsi, cette est un déterminant, et non un pronom — cette 
erreur peut provenir du dictionnaire utilisé). Certains mots posent en outre des difficultés 
particuliéres comme «du» (étiquette PRP : det, pour préposition et article contracté). 

L'apprentissage permet de disposer assez facilement et à moindre coût d'étiqueteurs 
morphosyntaxiques pour de nombreuses langues, y compris des langues anciennes et des 
langues rares. Il existe aussi des étiqueteurs pour certains types de langues particuliers 
(le français du xvir siècle, le français du xvii siècle, le français utilisé sur Twitter, 
etc.). La mise au point d'un étiqueteur peut de plus se faire de manière incrémentale : 
l'annotation rapide d'un petit corpus permet de produire un premier annotateur, relativement 
peu fiable. Celui-ci sert alors à annoter un corpus plus grand que le linguiste peut corriger 
(ce qui est beaucoup plus rapide que de procéder à une annotation compléte d'un 
texte brut sans pré-annotation). Ce nouveau corpus va permettre de produire un nouvel 
analyseur, beaucoup plus précis, et on procède ainsi de manière itérative jusqu'à ce que 
les performances correspondent aux exigences du projet. 

Les performances varient justement en fonction de la langue, des ressources disponibles 
(si on ne dispose pas d'un dictionnaire trés complet de la langue à analyser, l'analyseur est 
confronté à de nombreux mots inconnus qui font obligatoirement chuter les performances 
globales) et le temps passé à la mise au point du systéme (de facon incrémentale, comme 
on l'a vu). Pour le francais ou l'anglais, sur des corpus de presse, on dispose d'analyseurs 
ayant des performances de l'ordre de 0,95 à 0,98, c'est-à-dire que 95 à 98 % des étiquettes 
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posées sur les mots correspondent à la bonne étiquette (un nom bien identifié en tant que 
nom, un verbe en tant que verbe, etc.). Il s'agit de scores élevés, surtout si on prend en 
compte le fait qu'inévitablement certains de ces mots sont des mots «inconnus », c'est-à-dire 
non répertoriés dans le dictionnaire (le systéme doit alors inférer une catégorie possible, en 
fonction du contexte et éventuellement de la morphologie du mot). Il faut malgré tout garder 
en téte que 95 % d'étiquettes correctes, cela veut dire 5 % de mots mal étiquetés, donc en 
moyenne plus d'un mot par phrase mal catégorisé. Suivant le modèle d'analyse utilisé par 
la suite, cela peut avoir des conséquences catastrophiques, surtout si le mot mal analysé 
est central pour l'analyse de la structure globale de la phrase. C'est un des problémes des 
architectures classiquement utilisées en TAL : il s'agit souvent d'architectures en «pipe- 
line», où les modules sont enchainés les uns aux autres (l'analyse syntaxique après l'analyse 
morphosyntaxique, l'analyse sémantique aprés l'analyse syntaxique, etc.). Les erreurs ne 
peuvent donc que se propager, ce qui rend les systémes de TAL de ce type trés fragiles. 


4.3. Analyse syntaxique 


L'analyse syntaxique est une táche traditionnelle du TAL. Il s'agit, à partir d'une phrase simple 
(dans laquelle chaque mot est associé à une catégorie morphosyntaxique : nom, verbe, etc.), 
d'analyser la structure de la phrase?*. Cela peut se faire de deux manières : soit en identifiant 
les grands groupes syntaxiques dans la phrase (groupe nominal, groupe verbal) de maniére 
hiérarchique (les dépendances entre groupes sont alors représentées par les relations d’ inclusion, 
un groupe syntaxique comprenant lui-méme d'autres groupes syntaxiques), soit en identifiant 
les dépendances au niveau du mot, en partant du verbe (vu comme le «noyau» de la phrase) : 
l'analyse porte alors d'abord sur les relations partant du verbe (de type verbe > nom sujet 
ou verbe > nom objet) jusqu'aux relations de «bas niveau» (par exemple entre un nom et 
son déterminant). Dans les deux cas (analyse en constituants vs analyse en dépendances), on 
obtient un arbre syntaxique ou une structure proche de type graphe, indiquant les relations 
syntaxiques, c'est-à-dire les liens entre les mots au sein de la phrase (figure 5). 


| pons 
nsubj:pass case 
mone ar EE M. - 


| The dog chased by the 
punct 
amm mum pass obl —— 
RON“ XP:Pa5s RP "^ NOUN 
"= ce npecneasauee oT KOTKaTa 
nsubj:pass punct 
3| Pes byl honén kočkou 
< punct 
Le} 
Lo = -— —À 
4| Hunden jagades av katten 


Figure 5. Analyse syntaxique d'une méme phrase dans quatre langues différentes : 
anglais, bulgare, tchéque et suédois ? 
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On voit que les langues n'ont pas la méme structure, méme si elles expriment un contenu 
a priori équivalent. Certaines relations syntaxiques sont malgré tout partagées à travers 
les langues. L'encodage est fait ici au moyen des relations définies dans le référentiel 
Universal dependencies, qui vise à coder avec les mémes étiquettes les relations équi- 
valentes d'une langue à l'autre, facilitant ainsi les analyses contrastives entre langues *. 

Comme on peut s'en douter, les systèmes aujourd’hui ne fonctionnent généralement 
plus à partir d'ensembles de règles écrites à la main. Ils exploitent au contraire leur propre 
jeu de connaissances obtenu automatiquement par apprentissage à partir d'un corpus type, 
dit «corpus d'entrainement» (car il s'agit «d'entrainer» le système d'analyse à trouver la 
bonne solution à partir de l'observation de milliers ou de millions d'exemples). L'approche 
n'est pas magique : elle repose sur l'observation d'un trés grand nombre d'exemples et les 
performances des systémes automatiques sont dues à leur capacité à évaluer des contextes 
complexes et à faire des généralisations que l'humain ne saurait prévoir. Il existe aujourd’hui 
des systèmes très performants pour le français, l'anglais et la plupart des langues ayant une 
longue tradition de recherche en TAL (y compris pour des langues non indo-européennes, 
comme l’arabe ou le chinois par exemple). On trouve relativement facilement des outils 
libres et gratuits disponibles sur le Web pour quelques langues, mais le choix demeure 
malgré tout limité pour la plupart des langues en dehors de l'anglais. 

Les linguistes ne sont pas complètement ignorés dans la mesure où l'annotation des 
corpus nécessaires à l'entrainement des systémes est le résultat du travail, long et patient, 
de groupes de linguistes parfois trés nombreux. Cela n'est d'ailleurs pas sans conséquences, 
les linguistes étant parfois assimilés à de simples « fournisseurs de corpus», ce qui n'est 
évidemment pas un róle trés gratifiant. 

Pour finir sur l'analyse syntaxique, on peut revenir sur une initiative déjà citée, Universal 
dependencies, visant à unifier les schémas d'annotation syntaxique employés dans les 
différents projets d'annotation?". En effet, chaque groupe de recherche, ayant mis au 
point des corpus annotés spécifiques, a eu tendance à utiliser des Jeux d'annotations 
différents, ce qui a eu pour conséquence qu'une méme relation syntaxique peut avoir 
recu des étiquettes différentes dans deux corpus différents, tandis qu'une méme étiquette 
pouvait en fait recouvrir des réalités différentes. Un effort a donc été fait pour essayer 
de définir un jeu d'annotations (purement syntaxiques) suffisamment générique pour 
pouvoir étre employé dans différentes langues, c'est l'initiative Universal dependencies 
(une soixantaine de langues à ce jour ont produit des données validées et intégrées à la 
base Universal dependencies). Évidemment, cela implique qu'il y ait un jeu de relations 
fixe et partagé par toutes les langues (les différentes familles de langues ont aussi la 
possibilité de créer des étiquettes spécifiques si nécessaire). Sur le plan linguistique, cette 
initiative a permis de lancer des débats extrémement fructueux sur la notion de catégorie, 
de relation syntaxique et de variation entre langues. 

La disponibilité de corpus annotés syntaxiquement pour une soixantaine de langues dans 
un format commun est un grand progrès, mais il existe encore de nombreuses langues pour 
lesquelles il n'existe pas de telles ressources. Partant, une grande partie des recherches 
s'intéresse aujourd'hui à la production d'analyseurs pour des langues dites «sous-dotées » ?. 
Il existe différentes techniques pour développer des analyseurs pour des langues avec peu 
de ressources, mais la technique la plus répandue consiste à procéder par «transfert de 
connaissances », d'une langue à l’autre, avec ou sans corpus parallèle. Cette approche repose 
sur l'idée qu'il est possible d'exprimer des informations similaires dans toutes les langues, 
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méme si toutes les langues n’« encodent» pas ces informations de la méme maniére. Un 
moyen de développer un analyseur est alors de repérer ces informations dans une langue 
source et d'essayer d'inférer la facon dont elles sont exprimées dans la langue cible. 
Le processus est assez direct si on dispose d'un corpus parallèle (c’est-à-dire un corpus où 
à chaque phrase de la langue source correspond une phrase dans la langue cible) annoté du 
cóté de la langue source : l'analyseur essaie alors de découvrir des correspondances entre 
les langues en partant du principe que les mémes idées, c'est-à-dire les mémes relations 
entre les mots, se retrouvent de part et d'autre, en langue source et en langue cible. Il est 
aussi possible de développer ce type de technique sans lexique, ni corpus paralléle, mais 
l'approche est alors évidemment moins fiable et moins robuste. L'analyse procéde en essayant 
de repérer des similarités structurelles entre langues, ce qui reste relativement hasardeux 
(par exemple, si un verbe est ditransitif dans la langue source, il y a des chances pour qu'il 
ait aussi deux compléments dans la langue cible, etc.). 


4.4. Analyse sémantique 


ILest impossible de décrire de maniére synthétique les recherches touchant à la sémantique 
tant ce domaine recouvre des choses différentes. Une distinction pratique est celle qui 
place d'un cóté la sémantique lexicale et de l'autre la sémantique propositionnelle ou 
discursive, c'est-à-dire d’un côté l'étude du sens des mots, de l’autre l'étude des relations 
entre les mots dans la phrase et au-delà de la phrase. Il existe évidemment un recouvrement 
entre ces deux niveaux : certains mots ont des dépendants et leur sémantique entre donc 
directement en résonance avec la structure de la phrase. 

La sémantique lexicale a donné lieu à de nombreuses recherches sur le sens des mots 
en eux-mémes. Comment définir le sens? Comment déterminer le nombre de sens d'un 
mot? Peut-on calculer le sens d'un mot ou d'une expression à partir d'atomes de sens, 
parfois appelés primitives lexicales? etc.?? Des recherches complémentaires ont porté, 
comme on l’a dit, sur les relations des prédicats avec leurs dépendants (essentiellement les 
verbes, les noms et les adjectifs prédicatifs). Il existe enfin de trés nombreuses recherches 
portant sur les relations entre propositions et entre phrases, sur les notions de cohérence 
et de cohésion textuelles, sur la pragmatique ^. On citera ainsi l'analyse de différents 
phénomènes de portée (négation, quantifieurs, modaux), l'analyse de la référence et de 
la coréférence, l'analyse de figures de style comme la métonymie ou la métaphore, etc. 
Les liens (explicites ou implicites) entre phrases ont aussi fait l'objet de trés nombreuses 
recherches et ont abouti à des théories comme la RST (Rhetoric Structure Theory?) ou 
la DRT (Discourse Representation Theory”). 

La variété des modes de représentation possibles a peut-étre permis aux recherches 
en sémantique de garder un lien plus étroit entre théorie linguistique et formalisation 
informatique que d'autres domaines du traitement automatique des langues. Il faut toutefois 
noter que depuis quelques années, l'analyse distributionnelle généralisée a permis le 
développement de modes de représentation extrémement populaires et surtout extrémement 
efficaces (les plongements de mots, ou word embeddings, où les mots sont «plongés» 
au sein d'ensembles de mots plus larges apparaissant dans les mêmes contextes #). Cette 
approche trés calculatoire du sens a sans doute rendu beaucoup plus láche le lien entre 
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linguistique et TAL, au détriment des théories sur le lexique, développées jusque-la. En 
ce sens, la sémantique suit le courant général du TAL vers des approches plus empiriques. 

La sémantique lexicale est, on vient de le voir, actuellement marquée par des approches 
fondées sur l'observation de l'emploi des mots à partir de trés grands corpus (plusieurs 
milliards de mots). Il est ainsi possible de mettre en rapport les mots apparaissant dans des 
contextes similaires (en reprenant ainsi une idée déjà exprimée par Firth ^^). La puissance 
des approches statistiques est donc d'offrir «naturellement», par simple observation de 
corpus, une représentation continue du sens des mots (en utilisant toutefois des techniques 
informatiques pointues, dites de «vectorisation» et de «réduction de dimensions» qui 
permettent de rendre ces observations gérables et calculables, ce qui nécessite des 
ordinateurs extrémement puissants vu qu'il s'agit d'observer l'emploi de milliers de 
mots à partir de corpus de millions voire de milliards d'occurrences : l'idée générale est 
donc assez simple à saisir mais la mise en œuvre informatique est complexe). Ce mode de 
représentation continu du sens est obtenu de maniére purement calculatoire, mais il semble 
bien adapté à la langue. On peut, par exemple, représenter le rapport entre deux mots sous 
forme de «proximité sémantique » : ainsi, « voiture» sera trés proche d’« automobile», 
relativement proche de «véhicule» mais trés éloigné de «reblochon» ou «penser». Au lieu 
d'une distinction binaire synonyme / non synonyme qui n'a guère de sens, les approches 
continues permettent une représentation relativement pertinente des liens entre mots. 
Il faut toutefois noter que ces méthodes ne permettent pas de «typer» les liens entre mots, 
alors qu'il est souvent utile d'avoir aussi des relations sémantiques typées (hyponyme / 
hyperonyme, partie / tout, etc.). Les représentations continues (les vecteurs de mots ou 
les plongements de mots, c'est-à-dire des listes de mots apparaissant fréquemment dans 
le contexte d'un mot donné) peuvent avoir tendance à mettre ensemble des mots comme 
« voiture », « volant», «roue», «conduire», par exemple : il existe évidemment un lien 
entre ces mots, mais on aimerait avoir des relations sémantiques précises, typées, ce que 
les techniques actuelles ne font pas directement, en général. 

Les recherches sur le niveau prédicatif ont donné naissance à des travaux extrémement 
intéressants ces derniéres décennies. De trés nombreux travaux sont nés dans les 
années 1970 (et ont continué de se développer jusqu'à aujourd’hui pour certains projets). 
Passé l'enthousiasme suscité par la grammaire générative à ses débuts et la quéte un peu 
vaine de principes généraux organisant les langues du monde, il a bien fallu se rendre 
à l'évidence : une grande partie de l'information utile pour l'analyse des langues ne se 
cache pas dans des principes généraux mais doit étre encodée dans le lexique. On a alors 
assisté au développement des grammaires « guidées par les têtes », où la notion de «tête » 
renvoie aux éléments prédicatifs du lexique qui organisent de fait la structure de la phrase“. 
Autrement dit, la mise au point d'outils d'analyse performants exige de disposer d'un 
lexique complet de la langue, où à chaque mot sont associées une structure prédicative 
et différentes informations sur chacun de ses dépendants. Il s'agit donc de programmes 
de recherches à la fois ambitieux et extrémement puissants vu que le prédicat (le prédicat 
verbal en particulier) encode en fait en grande partie la structure des phrases. 

Comme on l’a dit dans la section consacrée à l'historique du domaine, dans les 
années 1970, Maurice Gross et son équipe mettent au point le «lexique-grammaire» du 
français, c'est-à-dire une description systématique et aussi exhaustive que possible des 
formes prédicatives de la langue avec, pour chaque classe lexicale, un ensemble de propriétés 
possibles et, pour chaque élément de la classe, pour chaque verbe par exemple, un ensemble 
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de + et de — suivant qu'une propriété est supportée ou non par l'élément considéré ^6. Par 
exemple, pour la passivation en de, danser recevait une valeur — et «aimer» une valeur +, 
car «on est aimé de qqn» mais on ne peut dire « *étre dansé de qqn». Le français était dans 
les années 1980 et au début des années 1990 une des langues les mieux pourvues en matière 
de dictionnaires électroniques, du fait des travaux de Maurice Gross et de son équipe. 
Depuis, des projets essentiellement américains ont permis d'aller plus loin en proposant 
des modèles plus modulaires, plus génériques, et surtout en suscitant des initiatives 
comparables pour plusieurs langues. On dispose ainsi du réseau sémantique Wordnet *’, 
initialement développé pour l'anglais mais qui a donné lieu à de multiples initiatives pour 
de nombreuses autres langues. La recherche continue aussi pour dériver de manière 
automatique ou semi-automatique des réseaux sémantiques compatibles avec Wordnet 
directement à partir de gros corpus. Il existe aussi de multiples projets visant à développer 
des descriptions syntaxico-sémantiques à large échelle, dans des cadres théoriques relativement 
divers. On citera ainsi Framenet ^, un projet visant à produire une description des structures 
prédicatives de l'anglais suivant la théorie dite Frame semantics ?. Cette théorie avait été 
développée par Fillmore depuis les années 1970, mais c'est dans les années 1990 que le 
projet Framenet a véritablement pris de l'ampleur, avec comme objectif de produire une 
ressource utilisable aussi bien par les humains que par les machines. Il y a donc d'un cóté 
la ressource elle-méme, et de l'autre un corpus annoté pouvant donner lieu à des recherches 
avancées mettant en jeu des techniques informatiques, notamment des techniques 
d'apprentissage artificiel pour inférer de nouvelles connaissances. On voit ici un lien fort 
qui subsiste entre pratique et théorie, modélisation linguistique et réalisation informatique, 
ce qui rend ce projet extrémement intéressant. 


Hoover Dam played a maor role in preventing Las Vegas from drying up 


play.v major.a prevent.v dry up.v 
Performer PERFORMERS Role Performance 
_AND_ROLES 
IMPORT. | Factor Undertaking 
ANCE 
Preventing. . Protagonist Action 


cause 


Entity BECOMING. DRY 


Figure 6. Analyse sémantique des prédicats et de leurs arguments au moyen de cadres, 
suivant la théorie appelée Frame semantics ® 


Sur la figure 6, chaque ligne d'annotation correspond à un cadre, c'est-à-dire à un prédicat 
(généralement un verbe) auquel sont associés des acteurs ayant un róle sémantique 
particulier. Les prédicats sont marqués par un encadré de couleur, et les acteurs du prédicat 
sont marqués par des traits de couleur (il y a ici quatre lignes, correspondant aux quatre 
prédicats de la phrase; les choix ne sont pas toujours intuitifs, comme dans notre exemple 
où c'est l'adjectif «major» qui est considéré comme prédicatif, et non le nom «role»). 
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La partie purement TAL vient ensuite : il s'agit de développer des analyseurs sémantiques 
capables d’annoter les textes (phrase par phrase) en fonction des connaissances des 
dictionnaires Framenet, à l'image des analyseurs syntaxiques entrevus précédemment. 
De trés nombreux analyseurs ont été mis au point ces derniéres années, mais ils souffrent 
encore de défauts majeurs. Outre les erreurs d'analyse, plus nombreuses pour le niveau 
sémantique que pour le niveau syntaxique, une difficulté supplémentaire est le caractére 
trés partiel des bases de données de type Framenet, méme pour l'anglais. Le coüt de mise 
au point de ces ressources est tel qu'il est trés difficile de faire aboutir ces projets, qui 
nécessiteraient des équipes de plusieurs dizaines de linguistes travaillant ensemble pendant 
des années. De plus, les utilisateurs se focalisent souvent sur une application précise (achat 
/ vente d'entreprises, analyse d'opinions ou de sentiments), qui nécessite des étiquettes 
sémantiques spécifiques qui ne sont pas obligatoirement celles de Framenet. Il y a donc 
une vraie difficulté au niveau de la précision de la description et de l'adaptabilité des 
bases de données à des besoins spécifiques. On peut méme se demander si ces projets 
peuvent aboutir puisque les étiquettes (prédicats et acteurs) sont définies a priori et ne 
correspondent pas obligatoirement à tous les usages en contexte. 

Au-delà de ces recherches en sémantique lexicale, 1l existe aussi de trés nombreuses 
recherches autour des relations entre les mots ou les phrases, allant au-delà de la simple 
analyse prédicative. L'analyse des anaphores et plus généralement des chaines de 
coréférence est un domaine clé, car il est par exemple primordial de savoir «qui parle» 
et «de qui on parle» dans un texte journalistique (c'est-à-dire, quelle est la source des 
discours rapportés), et il faut donc étre capable de repérer les différentes facons de faire 
référence à une personne dans un texte (« Emmanuel Macron... le Président... il...» etc.)?!. 
Comme on l'a déjà dit, les relations entre les phrases ont aussi donné lieu à de nombreuses 
théories et à des travaux importants, aussi bien dans une perspective linguistique que dans 
une perspective de traitement automatique. Cette tache est particuliérement difficile : 
il y a parfois des connecteurs entre les phrases, mais la plupart d'entre eux sont ambigus. 
Surtout, la plupart des phrases dans un texte quelconque ne sont pas liées explicitement par 
un connecteur à la phrase qui précède : la relation est alors implicite et il est extrêmement 
difficile de l'analyser automatiquement". Avoir une représentation des relations entre les 
phrases est important pour avoir une idée de la structure des textes, ce qui peut avoir des 
applications directes en matiére de résumé automatique par exemple, oü il est important 
de pouvoir déterminer l'importance relative d'une phrase ou d'un passage donné. 


4.5. Une analyse modulaire autour de modules réutilisables 


Au-delà du découpage traditionnel en phonétique, morphologie, syntaxe et sémantique, le 
TAL a progressivement vu émerger des besoins, avec de nouveaux modules et de nouvelles 
taches. C'est en particulier le cas de l'extraction d'informations dans les années 1980- 
1990. Le département de la Défense américain, aprés avoir financé de trés nombreuses 
équipes et de trés nombreux projets autour de la «compréhension de textes» dans les 
années 1970 et 1980, a essayé de mieux connaitre l'état de l'art. La táche s'est révélée 
impossible dans un premier temps, chaque équipe ayant une conception trés différente 
de la « compréhension de textes ». 

Aprés quelques années de réflexion, il est apparu que la tache pouvait étre décomposée, 
normalisée et faire l'objet d'étapes et de travaux relativement indépendants. On considére 
ainsi, séparément, le repérage des entités (les principaux acteurs du texte), de leurs 
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différentes dénominations, puis de leurs relations ?. Ce découpage a permis de définir 
des modules disponibles et a priori réutilisables dans de nombreux contextes. Ces táches, 
toujours d'actualité aujourd'hui, sont les suivantes : 

— Analyse des entités nommées : les entités nommées regroupent l'ensemble des 
séquences faisant référence à des entités connues, comme des personnes, des 
lieux, des entreprises ou des organisations. Par extension, les dates et les autres 
expressions numériques sont fréquemment assimilées aux entités nommées. Les 
termes techniques sont aussi parfois assimilés à des entités, ce qui revient alors à 
élargir la classe à toutes les expressions d'intérét pour un domaine donné. 

— Analyse de la coréférence : une méme entité peut être dénommée de façon très 
variée dans un même texte (par ex. «Emmanuel Macron », « Manu», «le président 
Macron», «le président», «il» ...). L'analyse de la coréférence vise à reconnaitre 
les différentes désignations d'une méme entité, ce qui a un intérét évident pour la 
compréhension du texte : on peut ainsi affecter à une méme entité l'ensemble des 
informations qui la concernent, quelle que soit la forme sous laquelle cette entité 
a été dénommée en pratique. 

— Analyse des relations entre entités : cette tache, au nom explicite, vise à identifier 
les relations entre entités telles qu'elles sont exprimées dans les textes. L'analyse 
de relation suppose une analyse correcte des prédicats (notamment les verbes et 
les noms prédicatifs) et, plus généralement, une analyse syntaxique correcte si on 
veut une analyse fiable et précise. 

— Analyse des événements : il n'y a pas de définition claire et précise de ce qu'est 
un événement mais, au-delà de la simple analyse des relations, il est fréquemment 
nécessaire d'identifier des ensembles de plus haut niveau, rassemblant un certain 
nombre de relations simples dont l'agrégat est assimilé à un événement. 

D'autres modules peuvent bien entendu être définis pour des besoins ou des tâches particulières. 
On a ainsi vu apparaitre depuis quelques années une analyse plus fine des informations 
temporelles au sein des textes, ce qui est intéressant pour un grand nombre d'applications 
impliquant des développements plus ou moins longs et leurs enchainements. Les précédents 
modules semblent toutefois garder une plus grande généricité et étre les plus communément 
repris au sein d'applications impliquant l'analyse de grandes masses textuelles. 

La définition de táches précises et la mise au point des modules de traitement 
correspondants ont eu pour conséquence une amélioration de la «réutilisabilité» des 
systèmes. Dans le méme temps, à partir du moment où un module peut être remplacé 
par un autre effectuant un traitement en principe similaire, il est possible de les comparer 
directement et simplement. Dés lors, au cours des années 1980, l'évaluation devient une 
question majeure, et la mise au point de mesures d'évaluation devient rapidement un 
domaine de recherche à part entière. 


5. L’ÉVALUATION DES SYSTÈMES DE TRAITEMENT AUTOMATIQUE DES LANGUES 


Un point important pour le traitement automatique des langues (comme pour tout domaine 
scientifique expérimental) est celui de l'évaluation. Cet aspect n'était pas si important 
de prime abord : les enjeux commerciaux étaient faibles et il était hors de question (ou 
hors de portée) de traiter la langue «courante». Partant, pendant longtemps la validation 
d'un système a consisté à montrer que celui-ci pouvait traiter certains phénomènes 
linguistiques particuliers considérés comme importants et/ou particuliérement complexes. 
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Pour l'analyse syntaxique par exemple, les développeurs disposaient souvent dans les 
années 1960-1980, de «test suites», un ensemble de phrases types que le systéme devait 
analyser. Chaque phrase comprenait une construction ou un phénoméne linguistique 
particulier et l'ensemble devait illustrer les difficultés typiques d'une langue ou d'un 
phénoméne donné. Le vocabulaire spécifique était enregistré a priori et la validation 
concernait essentiellement la capacité du système à faire face aux différentes phrases et 
surtout l'adéquation du type de modélisation obtenu en résultat. Il s'agissait donc d'une 
évaluation essentiellement qualitative. On sait que ce type d'évaluation est problématique. 
Le principal probléme vient du fait que dans ce genre de test, chaque phrase illustre un 
phénoméne particulier afin de vérifier qu'il est bien analysé par le systéme. Or, dans 
la réalité, de nombreuses phrases comportent des difficultés mélées et la capacité des 
systèmes à y faire face est trés mal prédite par les évaluations au moyen de test suites. 
La richesse du lexique d'une langue améne aussi à gérer simultanément de trés nombreuses 
ambiguités qui ne sont pas du tout prises en compte par les test suites. 

La période récente a changé la donne : les systémes ont maintenant des contraintes 
opérationnelles. Il n’y a donc pas de sens à les évaluer au moyen de tests connus à l'avance, 
avec un vocabulaire limité et prédéfini. C'est au contraire la capacité des systèmes à faire 
face à l'imprévu (à des phrases complexes, à des phénomènes linguistiques en interaction, 
à des mots et des expressions non connus à l'avance) qui a une importance cruciale. 


5.1. L'exemple de l'évaluation en traduction automatique 


Le domaine de la traduction automatique illustre à nouveau de maniére particuliérement 
pertinente l'évolution du domaine de l'évaluation. Dans les années 1950, les phrases à 
traduire sont connues à l'avance. Dans les années 1950 ou 1960, il est hors de question 
pour un systéme informatique d'embarquer le vocabulaire complet d'une langue donnée, 
au contraire : la mémoire des ordinateurs de l'époque oblige à limiter le vocabulaire et la 
complexité des régles d'analyse. On est alors davantage dans une étape de «faisabilité» 
(c'est-à-dire, en informatique, une étape destinée à évaluer, à travers un exemple réduit, 
si une tâche est réaliste ou non) que de test en grandeur nature, même si les ambitions de 
l'époque sont grandes. Progressivement, de manière éparse tout d'abord puis de manière plus 
soutenue à partir des années 1990, avec l'avénement des approches statistiques, le besoin 
de méthodes d'évaluation plus précises se fait jour. Pour la traduction automatique, le seul 
mode d'évaluation possible semble étre l'évaluation humaine, qui procéde par introspection 
(c'est-à-dire tout simplement en se demandant si le texte produit est satisfaisant ou non) ou 
par la comparaison d'une traduction automatique avec une traduction humaine de référence. 
Afin d'obtenir des résultats plus constants et surtout plus précis qu'une simple note globale 
affectée à une traduction, divers tests plus précis sont imaginés **. 

— Test de compréhension. Il s'agit d'un test ou l’évaluateur doit répondre à des 
questions définies à l'avance en fonction du texte. La qualité du système est déter- 
minée par le nombre de questions auxquelles le lecteur de la traduction a été capable 
de répondre correctement. Comme les premières campagnes concernaient un nombre 
limité de systémes capables de traduire vers l'anglais à partir de langues variées, cette 
méthode était bien adaptée : le texte à traduire était fourni dans différentes langues 
et la traduction en anglais devait alors pouvoir donner lieu à comparaison (ce test est 
d'ailleurs initialement nommé «direct comparability» car il est censé permettre une 
comparaison directe de différents systémes s'attachant à différentes langues sources). 
Ce test pose toutefois des difficultés, dans la mesure oü les textes d'origine ne sont pas 
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exactement les mémes : il n'est donc pas facile de dire si les problémes viennent du 
texte d'origine ou du systéme de traduction lui-méme. Ce test sera toutefois conservé 
pendant longtemps pour mesurer l’informativité d'une traduction (informativeness). 

— Panel d'évaluation. L'idée la plus évidente pour évaluer la qualité de traductions 
consiste à faire appel à des jugements humains, méme si on sait la trés grande 
subjectivité de ceux-ci. Cette méthode semble attrayante dans la mesure oü ce 
genre de mesure sert par ailleurs à évaluer la qualité de traductions humaines. 
Il s'agit donc d'une mesure largement diffusée et qui permet de comparer directement 
traductions automatique et non automatique. Ce type d'évaluation se heurte 
toutefois à deux difficultés majeures. Sur le plan pratique tout d'abord, il est trés 
difficile et coüteux de mobiliser un ensemble d'experts pendant toute la durée 
d'une évaluation. Plus fondamentalement, la nature des erreurs dans les textes 
produits automatiquement est si variée qu'il est extrémement difficile pour un 
expert d'affecter une note globale à un texte (ou alors cette note varie beaucoup 
d'un expert à l'autre, suivant l'importance attachée à tel ou tel type d'erreur par 
un expert donné). Malgré différentes tentatives d'homogénéisation des stratégies 
de notation, de grandes variations demeurent lors des expériences pratiques. 

— Adéquation (adequacy) et fluidité de la traduction (fluency). Vu l'échec de la note 
globale sur le texte, on a alors pensé à recourir à deux scores, appelés adequacy 
et fluency. Le score d'adéquation mesure à quel point une traduction automatique 
rend compte d'éléments d'information contenus dans un texte de référence 
(produit par un traducteur humain professionnel). Ces éléments d'information 
sont généralement des fragments de phrases contenant une information non 
ambigué et facile à repérer. La fluidité de la traduction (fluency) vise à vérifier 
la bonne formation des phrases, leur caractére idiomatique et la facilité qu'a un 
lecteur à les comprendre. Ces critéres semblent plus faciles à évaluer que l'affectation 
d'un score global aux traductions produites, mais ils restent subjectifs et les notes 
données par les experts varient encore sensiblement dans ce genre d'évaluation. 

— Traduction assistée. Une dernière stratégie d'évaluation part du constat qu'aucun 
système automatique n'est capable de fournir une traduction parfaite (et, pendant 
longtemps, les résultats étaient même trés imparfaits). Il semble donc pertinent 
d'évaluer dans quelle mesure un outil de traduction automatique peut permettre 
d'obtenir une bonne traduction, moyennant l'intervention d'un traducteur humain. 
Les expériences menées en ce sens au début des années 1990 impliquaient ainsi un 
traducteur novice, censé étre plus à méme de tirer parti d'une traduction imparfaite 
qu'un traducteur chevronné (qui est supposé voir plus directement comment «bien» 
traduire une phrase sans l'aide d'un processus automatique). L'évaluation porte sur 
la comparaison entre le résultat du processus automatique versus le résultat de la 
traduction améliorée par intervention du traducteur. Il reste toutefois très difficile 
d'évaluer l'apport d'un systéme automatique, puisque chaque novice est différent 
et utilise l'outil différemment au cours d'une évaluation. De fait, les résultats sont 
trés difficilement comparables d'un individu à l'autre, et sont donc trés subjectifs. 

Globalement, on sait que les notes attribuées par des individus dans l'absolu sont trés 
variables et comportent un degré de subjectivité important, mais les classements sont 
quant à eux beaucoup plus fiables et beaucoup plus utiles. Cela veut dire concrétement 
que si l'on demande à des évaluateurs de mettre des notes sur le résultat de différents 
systémes, le résultat sera subjectif et variable d'un évaluateur à l'autre. En revanche, si 
on demande de classer les systémes, on obtient un résultat beaucoup plus fiable et assez 
largement reproductible d'un évaluateur à l'autre. 
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Ce mode d'évaluation a quand méme encore un défaut majeur, surtout à l'heure ot 
chaque systéme peut produire de multiples traductions en fonction de simples changements 
de paramétres : il est difficile et coüteux de mobiliser une équipe d’évaluateurs en 
permanence, d'autant que la táche est fastidieuse et ingrate. C'est pourquoi, dés les 
années 1990, les chercheurs essaient de mettre au point des méthodes d'évaluation fiables 
(c'est-à-dire bien corrélées aux évaluations humaines) entiérement automatiques, donc 
rapides et complétement reproductibles. 

Une mesure d'évaluation automatique émerge assez rapidement. Il s'agit de la mesure 
appelée BLEU. Le principe en est relativement simple : le texte à évaluer est découpé 
en séquences continues, par exemple des séquences de quatre mots. Pour la phrase qui 
précéde, ces séquences de quatre mots sont : «1l s'agit de la», «s'agit de la mesure», 
«de la mesure appelée», «la mesure appelée BLEU», etc. Le système calcule ensuite 
combien de ces séquences sont contenues dans une ou, en général, plusieurs traductions 
de référence. Le score est ensuite normalisé de façon à obtenir une valeur entre 0 et 1 (si le 
score est 0, il n’y a aucune séquence de 4 mots commune entre le résultat de la traduction 
automatique et les traductions de référence; si le score est 1, toutes les séquences de la 
traduction automatique étaient déjà contenues dans les traductions de référence). Un 
mode d'évaluation relativement similaire peut étre congu pour le résumé automatique 
par exemple : on compare ainsi le nombre de séquences communes entre le texte produit 
automatiquement et un ou des résumés de référence. Dans les deux cas, certains mots 
ou certaines expressions essentiels peuvent étre considérés comme plus importants et 
recevoir un «poids » supérieur (c'est-à-dire que le système reçoit un bonus s’il a réussi à 
produire ces séquences essentielles). Dans tous les cas, il s'agit de comparer des segments 
relativement courts de texte à un texte de référence. 

On peut étre surpris par le caractére un peu frustre des méthodes d'évaluation 
automatique. Leur simplicité est toutefois ce qui a fait leur succès : elles sont faciles à 
mettre en ceuvre et produisent des résultats reproductibles. Plus important, les scores relatifs 
qu'elles fournissent (par exemple pour classer une dizaine de résumés ou de traductions) 
sont relativement bien corrélés avec les résultats humains. Il en va de méme pour évaluer 
les différents paramètres d'un système de traduction par exemple : une mesure comme 
BLEU, aussi simple soit-elle, fournit généralement des résultats pertinents et permet ainsi 
de choisir les bons paramètres sans avoir besoin d'une évaluation plus précise. Il faut 
toutefois garder à l'esprit que ce type d'évaluation reste fragile et ne peut se substituer à 
un examen humain de la qualité des traductions ou des résumés. 


5.2. D'autres mesures d'évaluation 


En dehors de la traduction automatique, un grand nombre d'applications vise à sélectionner 
des éléments parmi un ensemble, ou à annoter (ce qui revient aussi à sélectionner puis à 
choisir une étiquette particuliére pour les objets sélectionnés) : sélection de documents 
pertinents par rapport à une requéte (moteur de recherche) ou annotation d'entités nommées 
par exemple (reconnaissance des noms propres, des noms de lieux, etc.). Des stratégies 
d'évaluations automatiques ont aussi été imaginées pour ce type de cas ?*. 

Il faut en fait déterminer deux types d'erreur. D'une part, les éléments reconnus à tort 
par le systéme : par exemple les liens vers des documents non pertinents proposés par un 
moteur de recherche. D'autre part, les éléments non repérés par le système : par exemple, 
un document pertinent par rapport à ma requéte que le systéme n'a pas pu identifier 
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(le document peut étre pertinent mais ne pas contenir les mots clés de la requéte par 
exemple). Le premier cas est relativement facile a évaluer : il suffit d’examiner les 100 ou 
1000 premiers liens vers des documents du moteur de recherche et, pour chacun d’eux, de 
déterminer s’il s'agit d'un lien pertinent ou non. Le second cas est beaucoup plus difficile 
à calculer en pratique : si le fonds documentaire est composé d'un million de documents, 
il est quasiment impossible de déterminer à la main et a priori ceux qui sont pertinents. 

Cette mesure peut aussi s'appliquer à une tache d'annotation ou de reconnaissance. 
Par exemple, si le systéme doit «reconnaitre» (ou annoter, ce qui est en fait la méme 
táche) les noms de lieux, je peux évaluer ce qui a été reconnu à tort comme un nom de 
lieu, et ce qui a été oublié par le systéme (en plus de ce qui a été reconnu correctement, 
bien évidemment). Il faut donc disposer de deux mesures différentes pour caractériser 
un système : on parle de précision et de rappel. 

— La précision correspond au pourcentage d'éléments pertinents identifiés par le 

systéme parmi tous les éléments identifiés. 

— Lerappel correspond au pourcentage d'éléments pertinents identifiés par le systéme 

parmi tous les éléments à identifier. 
Par exemple, si le fonds documentaire est composé de 100 documents, dont 8 sont 
pertinents par rapport à la requête utilisateur. Le système propose 12 documents, dont 
6 sont pertinents. La précision est alors de 0,5 (6 documents sont pertinents parmi les 
douze proposés, donc 6/12 — 0,5). Le rappel est de 0,75 (6 documents pertinents ont été 
retrouvés parmi les 8 qui étaient à retrouver, donc 6/8 = 0,75). On parle aussi de « bruit», 
qui est le complémentaire de la précision (6 documents ont été proposés à tort, c'est le 
« bruit») et de «silence», pour désigner les documents qui auraient dû être identifiés 
mais ne l'ont pas été (ici, il y a 2 documents qui ont été «oubliés», c'est le «silence»). 

Pour obtenir une seule mesure et pouvoir comparer plusieurs systémes, ou plusieurs 
versions d'un méme systéme, on calcule la F-mesure, qui est en fait la « moyenne 
harmonique» de la précision et du rappel. Si on donne le méme poids à la précision et 
au rappel, la F-mesure est équivalente à : 

— F-mesure = 2 x (précision x rappel) / précision + rappel 
La moyenne harmonique permet de privilégier les systémes ayant un rappel et une précision 
homogènes (par opposition à une simple moyenne qui ne permettrait pas de privilégier 
ainsi l'homogénéité des résultats entre précision et rappel). 

Ces mesures peuvent sembler un peu techniques, mais elles sont essentielles pour 
le domaine. Elles permettent de comparer des systémes sur une base objective (on peut 
discuter de la pertinence des mesures, en particulier des mesures automatiques, mais 
celles-ci donnent des résultats rapides, stables et reproductibles). Il y a eu de nombreuses 
propositions d'amélioration de ces mesures (l'évaluation et les mesures d'évaluation 
constituent un domaine de recherche en soi au sein du TAL), mais ces propositions ont 
souvent produit des mesures plus complexes, sans bénéfice clair. 


5.3. Les campagnes d'évaluation 


Une campagne d'évaluation vise à évaluer par comparaison, de facon contrólée et en 
temps limité, des systémes autour d'une táche commune. En pratique, des données 
sont fournies, et un descriptif trés précis et trés normé du résultat recherché est défini. 
L'évaluation est faite en comparant les résultats fournis par les systèmes à des résultats 
prédéfinis, généralement produits par des humains. On peut ainsi classer des systèmes, 
comparer les approches et les performances, et les avancées au cours du temps (sur ce 
sujet, on consultera les références données dans la section précédente). 
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À partir du moment où la tâche a été clairement définie (identifier des documents par 
rapport à une requéte pour la recherche d'information, retrouver des informations clés 
pour l'extraction d'information, produire une traduction ou un résumé d'un texte source 
pour la traduction ou le résumé automatiques), un protocole et un calendrier sont définis 
(date de début et de fin de campagne, format des données à rendre, etc.) et les participants 
ont un temps limité, défini à l'avance pour mettre au point leur systéme et participer à la 
campagne elle-méme. L'évaluation porte généralement sur des données qui ne sont pas 
disponibles avant la campagne, et le temps de participation est en général suffisamment 
limité pour qu'une intervention manuelle soit impossible (et les formats trés stricts imposés 
obligent de toute facon à utiliser une approche automatique, ce qui évite toute tricherie). 
Dans les campagnes les plus strictes, les systèmes d'analyse doivent méme être fournis, 
ce qui veut dire que les résultats sont alors à 100 % reproductibles. 

Les derniéres années ont vu une augmentation du nombre de campagnes d'évaluation. 
On a déjà évoqué ce point dans la partie consacrée à l'histoire et à l'évolution du domaine 
de la traduction automatique. Les premiéres campagnes ont concerné la recherche et 
l'extraction d'information, qui étaient les applications phares des années 1980. Des la fin 
des années 1980, les autorités américaines lancent les premiéres campagnes destinées à 
la fois à unifier la tâche et à comparer les performances relatives des systèmes. 

La nécessité d'unifier les taches a existé dans tous les domaines, mais cela était 
particuliérement vrai en extraction d'information. La táche s'appelait en fait au début 
«compréhension de message », ce qui n'est guére précis. De fait, dans les années 1970 
et 1980, de nombreuses équipes travaillaient sur le théme de la compréhension de texte, 
mais chacune produisait des résultats trés différents sur des corpus particuliers. Il est 
donc apparu nécessaire de normaliser la tache pour pouvoir comparer les approches, 
ce qui a amené à définir plusieurs étapes (analyse des entités, de la coréférence, des 
relations entre entités, des événements, etc.), ce qui a entrainé par la méme occasion la 
mise au point de modules comparables, adaptables et réutilisables comme on l'a déjà vu. 
Le point plus négatif concerne certainement l'uniformisation des recherches du fait de 
ces campagnes (les résultats doivent avoir un format prédéfini, et la compétition amene 
chacun à utiliser les meilleures techniques connues du moment, au détriment d'approches 
plus expérimentales, peut-étre moins performantes sur le coup mais plus prometteuses à 
long terme), ce qui va en partie à l'encontre de la créativité des chercheurs. 


6. QUELQUES EXEMPLES DE LIENS FORTS ENTRE RECHERCHE EN TAL ET RECHERCHE 
EN LINGUISTIQUE 


6.1. Traitement automatique des langues et lexicologie 


La lexicologie vise à décrire le sens des mots et leur usage’. Le travail du lexicologue 
est donc fondé sur sa connaissance de la langue, mais aussi et surtout sur un travail 
d'observation des unités linguistiques en contexte, l'introspection étant souvent insuf- 
fisante. Il faut en effet s'assurer de l'usage commun, des diverses acceptions des mots, 
de leurs sens dans des domaines spécialisés que les lexicologues ne peuvent maitriser 
systématiquement, etc. Les lexicologues ont beau s'entourer de toutes les précautions 
nécessaires, leur travail d'observation est obligatoirement limité par leur capacité à 
observer de grandes masses de données. 

La disponibilité de trés gros corpus et d'outils d'analyse automatique mis au point par 
le TAL a en partie changé la donne. Il existe aujourd’hui plusieurs outils qui permettent 
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de faire des observations sur l'usage des mots, de calculer des fréquences d'occurrences, 
de fournir la liste des principaux dépendants, etc. Ces outils ne remplacent pas l'expertise 
du lexicologue, mais ils peuvent l'aider à prendre les bonnes décisions, c'est-à-dire à 
décider combien de sens attribuer à tel ou tel mot, à choisir l'exemple le plus typique, à 
Observer l'évolution du sens ou de l'usage des mots, la langue étant en constante évolution. 
Un des outils les plus emblématiques et les plus populaires est le SketchEngine *, illustré 
par la figure 7. Il s'agit d'un outil trés largement utilisé par les éditeurs de dictionnaires, les 
terminologues et plus généralement par le monde de l'enseignement et de la recherche. 
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Figure 7. Interface du système appelé SketchEngine ?. 


Ce systéme permet diverses manipulations sur corpus : ici, l'utilisateur essaie de diffé- 
rencier therapy de chemotherapy en examinant les contextes les plus caractéristiques des 
deux mots considérés, c'est-à-dire les mots apparaissant uniquement dans l'entourage de 
therapy, et ceux qui apparaissent uniquement dans l'entourage de chemotherapy (mots 
apparaissant sur fond grisé clair ou foncé sur l'image). 

Une fonctionnalité extrémement précieuse permet d'identifier automatiquement les 
contextes les plus caractéristiques de deux mots proches sémantiquement. En identifiant 
les éléments différenciateurs, l'outil aide le lexicologue à discerner les spécificités des 
mots les uns par rapport aux autres. 


6.2. Traitement automatique des langues et «langues de terrain» 


Par «linguistique de terrain», on désigne le travail de chercheurs étudiant des langues peu 
connues et peu documentées, pour lesquelles il est nécessaire d'aller «faire du terrain», c’est- 
à-dire d'aller sur place à la rencontre des locuteurs pour recueillir des données originales. 


58. Killgarrif et al. (2004, 2014); voir aussi le site Web http://www.sketchengine.eu 


59. Source de l'illustration : https://www.researchgate.net/figure/Sketch-Difference-for-the-comparative- 
study-of-the-terms-therapy-and-chemotherapy fig3 325145911 (visité le 21 janvier 2019). 
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C'est une branche de la linguistique extrêmement importante, à une époque où nombre de 
langues disparaissent sans laisser de trace. Ce travail de recueil de données est donc essentiel. 

Or, on sait que le recueil et surtout l'analyse des données constituent un travail trés 
long et trés fastidieux. Une heure d'enregistrement nécessite souvent des heures, voire 
des mois de travail si on veut y ajouter une transcription phonétique et une analyse 
syntaxique et / ou sémantique. Ce travail est fait, encore aujourd'hui, presque entiérement 
à la main au sein de logiciels comme ELAN (https://tla.mpi.nl/tools/tla-tools/elan/), ce 
qui a plusieurs conséquences : les données mises à disposition sont souvent de trés petite 
taille, ce qui est évidemment un probléme pour nombre d'études qui auraient besoin de 
plus de données pour parvenir à des résultats fiables. Parallèlement, beaucoup de données 
brutes restent «dans des armoires » faute de temps et de moyens pour les analyser et les 
mettre à disposition dans des formats «propres». 

La collaboration avec le domaine du TAL est balbutiante, mais a déjà donné des 
résultats prometteurs. La premiére étape consiste à développer des outils d'analyse et 
d'enregistrement adaptés, sur des dispositifs (typiquement, des téléphones portables) 
demandant peu d'énergie, ce qui permet aux linguistes de travailler plusieurs jours 
sans avoir à trouver de prise de courant. De maniére plus fondamentale, on dispose 
aujourd’hui d'outils d'analyse du signal pour segmenter automatiquement un flux de 
parole, reconnaitre les sons, identifier des intonations, etc. ^ Une fois le texte transcrit, 
on dispose d'outils d'analyse morphosyntaxique qui peuvent facilement étre adaptés à 
de nouvelles langues, méme avec des jeux de données limités pour l'apprentissage. 
Il existe donc plusieurs initiatives visant à faire se rencontrer et «se parler» les experts 
des deux domaines, et on peut ainsi espérer des résultats communs. Tel est déjà le cas par 
exemple pour l'analyse syntaxique : des corpus arborés ont été mis au point suivant le 
standard Universal dependencies (voir supra) et sont mis à disposition de la communauté 
scientifique grace à des collaborations entre linguistes et informaticiens. 


6.3. Traitement automatique des langues et acquisition du langage 


Le domaine de l'acquisition du langage est en fait assez proche de la linguistique de 
terrain. Dans un cas comme dans l'autre, les chercheurs procèdent par des enregistrements 
(audio ou vidéo) qu'il faut ensuite analyser. Cette analyse se fait généralement sous 
forme d'annotations apportées au texte transcrit : étiquettes morphosyntaxiques sur les 
mots, liens syntaxiques entre mots, étiquettes sémantiques. Dés les années 1980-1990, 
les chercheurs ont fait le constat que l'analyse manuelle était très coûteuse, en temps et 
en moyens. L'outil informatique pouvait fournir des éléments de solution. 

La première étape a alors consisté à constituer une base partagée où tous les corpus 
seraient mis gratuitement à disposition de la communauté. Il s'agit du projet Childes 
(Child Language Data Exchange System®) conçu dés 1984, et qui a depuis connu un 
immense succès. Le site contient plus de 130 corpus dans plus de 25 langues (avec, 
évidemment, des volumes de données et une qualité d'analyse trés variables suivant les 
langues et les corpus considérés). Il s'agit aujourd'hui d'un site incontournable pour 
quiconque souhaite travailler sur l'acquisition des langues, que ce soit pour mettre au 
point des données pour une nouvelle langue et les diffuser, ou pour entamer une étude 
à partir de données existantes. L'avantage du partage est en outre de permettre à de 
nouveaux chercheurs d'enrichir les données existantes (en ajoutant par exemple une 


60. Besacier et al. (2014) et Michaud et al. (2018). 
61. Nivre et al. (2016). 
62. https://childes.talkbank.org ; voir MacWhinney (2000). 


Le traitement automatique des langues : tendances et enjeux 45 


nouvelle couche d'annotations). Le projet Childes s'est accompagné dés le début de la 
mise au point de standards d'annotation, ce qui garantit la «réutilisabilité» des données 
et leur enrichissement progressif par différentes équipes. 

L'étape suivante a consisté à définir des outils d'analyse et d'annotation automatique 
(CLAN : Child Language Analysis 9). Les outils d'analyse permettent, d'un cóté, 
de faire des requétes complexes sur les corpus existants et, de l'autre, d'obtenir des 
indicateurs classiques en acquisition du langage (diversité lexicale, longueur moyenne 
des énoncés des enfants, etc.). La partie TAL proprement dite concerne l'intégration 
d'outils d'annotation automatique qui peuvent aider à accomplir certaines táches, comme 
l'étiquetage morphosyntaxique. On peut dire que le domaine de l'acquisition automatique 
des langues est un cas exemplaire de partage des données, de travail collaboratif et de 
mise au point d'outils exploitant au mieux la puissance des outils informatiques et plus 
particuliérement du traitement automatique des langues. 


6.4. Traitement automatique des langues et recherches en typologie linguistique 
(et linguistique historique) 


Un domaine trés différent de la linguistique est celui de la modélisation de la variation et 
de l'évolution des langues. Ces dénominations recouvrent en fait différentes faces d'un 
méme probléme : d'un cóté, on essaie de déterminer comment les langues ont évolué à 
partir de leurs caractéristiques connues; de l'autre on essaie de caractériser les grandes 
familles linguistiques en synchronie, sur la base de traits partagés. Ces recherches sont 
populaires parce que l'étude des liens entre langues peut avoir un fort impact sur un public 
large et non spécialisé. Elles sont aussi parfois contestées car les études sont souvent 
fondées sur des données assez pauvres (des listes de mots appartenant au vocabulaire 
dit «de base», souvent des listes de Swadesh“) ou sur des bases de données trés larges 
et trés précieuses, mais contenant aussi nombre d'informations discutables et/ou non 
vérifiées (comme le WALS, World Atlas of Language Structures 9). 

Il n'empéche : on ne peut que constater un essor trés important des recherches à partir 
de ces bases de données, afin d'essayer d'obtenir une modélisation plus systématique 
des rapprochements entre langues que celles proposées jusqu'ici par les spécialistes du 
domaine. Au-delà de la confirmation de rapprochements connus, ce type d'approche 
permet une modélisation beaucoup plus fine des liens entre langues ou dialectes sur la 
base d'isoglosses, ou de groupes d'isoglosses, permettant de mettre au jour des liens 
peu connus ou peu observés jusque-là. La mise au jour de nouveaux phénomènes est 
évidemment entiérement dépendante des bases de données utilisées, ce qui fait dire à 
certains linguistes que ces outils n'apportent finalement pas grand-chose dans la mesure 
où l'information est contenue dans les bases de données et non dans les modélisations 
proposées (figure 8). 


63. MacWhinney (2019). 


64. On peut donner ici la définition de Wikipedia (https://fr.wikipedia.org/wiki/Liste Swadesh) : 
«Liste de mots appartenant à une partie du lexique la plus résistante au changement établie par le 
linguiste et anthropologue américain Morris Swadesh, dans les années 1940-1950. Elle est utilisée 
en linguistique comparée, en linguistique historique et aussi en anthropologie pour notamment 
identifier le lexique de base de toute langue étudiée pour la premiére fois, ainsi qu'établir le degré 
de proximité de deux ou plusieurs langues.» 


65. https://wals.info; voir Jager et al. (2018). 
66. François (2017). 
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Figure 8. Reconstitution et modélisation de liens entre langues à partir de l'analyse de bases 
de données de linguistique historique. À gauche, reconstitution sous forme d'arbre des liens 
de parenté entre langues indo-européennes ®, à droite, reconstitution sous forme de réseau 
des liens entre langues finno-ougriennes ®. 


Pour toutes ces raisons, la reconstitution de la généalogie des langues par ordinateur est 
un domaine polémique. Les techniques utilisées sont de type « clustering », la branche de 
l'informatique modélisant la façon de regrouper des objets suivant des caractéristiques 
communes (il s'agit ici de regrouper des langues suivant des propriétés linguistiques). 
Le clustering est fortement employé dans les biotechnologies, ce qui amene les chercheurs 
à faire des analogies (ot les langues sont vues comme des organismes vivants) plus ou 
moins fondées. En conclusion, on peut dire que ces études sont effectivement intéressantes 
quand elles sont fondées sur des bases de données larges, fiables, ayant fait l'objet de 
vérifications par des spécialistes du domaine. 


67. Gray et al. (2011). Source de l'illustration : https://royalsocietypublishing.org/doi/full/10.1098/ 
rstb.2010.0378 (visité le 21 janvier 2019). 


68. Lehtinen et al. (2014). Source de l' illustration : https://journals.openedition.org/efo/7099 (visité le 
21 janvier 2019). 
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7. LES GRANDS DOMAINES D^APPLICATION DU TRAITEMENT AUTOMATIQUE DES LANGUES 
AUJOURD?’ HUI 


Le traitement automatique des langues n’est pas un domaine monolithique : de nombreuses 
applications ont vu le jour au fur et à mesure que la technologie s'améliorait?. Certaines 
applications sont connues du grand public (comme la traduction automatique, la correction 
orthographique ou aujourd’hui, avec le développement des téléphones mobiles, la recon- 
naissance vocale), et d'autres moins (l'apprentissage en ligne, les agents conversationnels). 
Il semble donc utile d'en dresser un rapide panorama, en donnant à chaque fois quelques 
éléments de l'état de l'art, pour pouvoir apprécier la complexité de la táche et la diffusion du 
type d'application considéré. Nous examinerons successivement les applications suivantes : 
moteurs de recherche, fouille d'opinion, classification de documents, traduction automatique, 
correction orthographique et grammaticale, résumé automatique, apprentissage en ligne, 
reconnaissance vocale et dialogue humain-machine, agents conversationnels. 

Il existe à chaque fois autant de façons d'utiliser la technologie qu'il y a d'utilisateurs, 
mais on peut tout de méme regrouper certaines applications en grands ensembles. Les 
moteurs de recherche sont le point d'entrée face à la masse de documents disponibles 
sur le Web ou dans des fonds d'archives particuliers. Il s'agit d'identifier des documents 
pertinents à partir d'une requéte composée de mots clés. À partir de là, plusieurs applications 
sont liées : classification de documents, fouille d'opinion, éventuellement traduction pour 
traiter les documents en langue étrangère. La correction orthographique et grammaticale 
aun statut à part : il s'agit avant tout d'un outil à usage personnel qui doit aider à corriger 
des textes en cours de rédaction. Le résumé peut étre employé dans tous ces contextes : 
soit pour synthétiser des informations disponibles sur le Web, soit pour produire un 
résumé de ses propres textes. 

Les applications vocales représentent l'autre grand domaine d'innovation. L'utilisation 
de la voix a longtemps été une perspective lointaine : pendant des décennies, les experts 
ont prédit le développement des interfaces vocales sans que celles-ci se développent 
réellement (les ordinateurs étaient employés en entreprise, et il était incongru d'envisager 
une interface vocale dans ce contexte, surtout en open space). La donne a réellement 
changé avec le développement de téléphones portables, utilisables dans des endroits 
publics, où l'utilisateur peut parler librement. Une fois franchi l’obstacle psychologique 
qui consiste à parler à son téléphone dans des endroits publics, les interfaces vocales ont 
pu se développer largement, sur téléphone portable puis sur ordinateur. 

Il existe de nombreuses autres applications, comme les systémes d'apprentissage de 
langue en ligne, qui sont plus spécifiques mais importantes pour le domaine du traitement 
automatique des langues. Nous allons examiner rapidement chacune de ces applications. 


7.1. Les moteurs de recherche 


Le principe du moteur de recherche est à la fois simple et bien connu. Il s'agit de retrouver, à 
partir d'un fonds documentaire, les documents pertinents pour une requéte donnée. En général 
ces documents sont hiérarchisés, c'est-à-dire que les documents les plus pertinents doivent 
figurer en tête de liste (le fonds documentaire le plus connu est aujourd’hui le Web, mais il 
existe de nombreux autres fonds documentaires, spécifiques, de Gallica à la Bibliothéque 
nationale de France jusqu'aux fonds d'archives d'entreprises ou d'associations particuliéres 
— nous employons ici le mot «fonds documentaire » dans un sens trés lache, désignant 
n'importe quel ensemble important de documents contenant des informations à retrouver)". 


69. Poibeau (2003, 2011). 
70. Sire (2016). 
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On a là l'exemple méme d'une application en apparence simple, mais en fait extrêmement 
complexe. Tout d'abord la notion de pertinence est éminemment subjective : ce qui est 
pertinent pour une personne le sera beaucoup moins pour une autre, et la présence de 
mots clés est un indicateur relativement faible pour juger de la pertinence d'un document, 
surtout quand le fonds documentaire comprend des milliards de documents, comme le 
Web. Les requétes des utilisateurs sont aussi souvent trés courtes : il est connu que les 
requétes sur le Web, dans un moteur de recherche grand public (Google, Yandex ou Baidu 
par exemple), dépassent rarement deux à trois mots, ce qui rend d'autant plus difficile 
la recherche de documents pertinents. Il faut ensuite gérer non seulement la variation 
des mots (singulier / pluriel, formes conjuguées, etc.) mais aussi, éventuellement, leur 
sémantique (synonymes, etc.). En pratique, il existe trés peu de moteurs généralistes qui 
proposent une recherche sémantique (suggestion de synonymes, de mots liés, etc.), vu la 
difficulté de la tache, mais on peut trouver ce type d'offres à destination de professionnels, 
dans le domaine du droit ou de la médecine notamment, où il est important de pouvoir 
spécialiser les lexiques utilisés pour la recherche. 

Les algorithmes utilisés pour répondre au probléme de la recherche sur Internet étaient 
d'abord assez simples : étaient jugés pertinents les documents qui contenaient le plus de 
mots de la requéte (avec différents facteurs de normalisation, comme la taille du document 
par exemple). Mais, on l'a dit, les requétes sont courtes et les documents nombreux sur 
Internet : les simples critéres de fréquence et de cooccurrence de mots clés ne sont donc 
pas suffisants. L'idée, à la fois simple et révolutionnaire, apportée par les concepteurs de 
Google en 1998, a consisté à utiliser la structure du «graphe » du Web en plus de la présence 
de mots clés"'. Le propre du Web est en effet de contenir des «liens» qui permettent 
de renvoyer d'une notion ou d'une page à une autre pour former ce que l'on appelle un 
«hypertexte» (un hypertexte est un graphe dans la mesure oü il est composé d'un ensemble 
de liens que l'on peut formaliser comme des «arcs» dans un graphe). Ces liens ne sont 
pas neutres : une page qui a beaucoup de liens qui «pointent» vers elle a des chances 
d'étre une page de référence, c'est-à-dire une page trés pertinente. À l'inverse, une page 
isolée vers laquelle aucune autre page ne pointe n'a sans doute pas grand intérêt. C'est la 
base de l’algorithme PageRank, qui s'est considérablement complexifié depuis mais qui 
exploite à l'origine une idée simple, à savoir méler la présence de mots clés à l'analyse 
de la structure du « graphe du Web» (c'est-à-dire la structure dessinée par l'ensemble des 
liens hypertexte sur Internet). La prise en considération de ces deux éléments (mots clés 
et liens) a permis à Google d'obtenir immédiatement un résultat infiniment plus pertinent 
que le moteur Altavista, qui était hégémonique avant 1998. Altavista disparaitra alors 
trés rapidement au profit du nouveau venu, Google, qui garde depuis une position ultra- 
dominante (sauf dans certains pays contrólant étroitement à la fois Internet et les outils 
d'accés au Web comme la Chine avec Baidu ou la Russie avec Yandex). 

Il faut enfin noter l'évolution des moteurs de recherche. Ceux-ci ne se contentent plus 
de fournir simplement des liens vers des pages pertinentes. Sans qu'on en ait toujours 
conscience, leurs fonctionnalités ont bien évolué. Une anecdote illustrera ce point : 
pendant la session Clelia 2018, nous étions plusieurs à chercher le nom de l'aligot, sans 
arriver à retrouver ce mot, bien enfoui dans notre mémoire. Une recherche sur Google 
avec comme mots clés «purée», «fromage », « Cantal» permet visiblement à Google 
d'inférer que notre recherche concerne l'aligot. 


71. Langville et Meyer (2012). 
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* Etape 1. Couper le cantal en fines lamelles ou le ráper. 


e Etape 2. Faire cuire les pommes de terre en robe des champs, les écraser au 
presse-purée. ... 


* Etape 3. Sur feu doux y mélanger le lait, le beurre, la crème, l'ail, le sel et le 
poivre. ... 


* Etape 4. ... 
e Etape 5. 


Aligot au cantal : Recette de Aligot au cantal - Marmiton 
https://www.marmiton.org/recettes/recette aligot-au-cantal 60236.aspx 


@ Apropos de ce résultat M Commentaires 


Autres questions posées 


Quel fromage utilisé pour l'aligot ? 
Quelle est la différence entre l'aligot et la truffade ? 
Quel est le fromage de l'aligot ? 


Quel accompagnement avec l'aligot ? 


Figure 9. Résultat d'une recherche avec le moteur de recherche de Google 
pour la requéte «fromage purée Cantal» ?. 


Au-delà d'une liste de liens vers des documents censés répondre à la requéte, on voit 
(figure 9) que Google propose d'autres services «intelligents». Ici, la requéte («fromage 
purée cantal») visait en fait à identifier le mot «aligot». Non seulement Google a inféré que 
l'utilisateur cherchait à se renseigner sur l'aligot, mais le moteur de recherche donne aussi 
comme résultat la recette de l'aligot, et différentes questions pertinentes dans ce contexte. 

On voit là la puissance du moteur de recherche qui, loin de se contenter de fournir des 
liens vers des documents contenant des mots clés, peut en fait répondre à des questions 
implicites, retrouver les documents pertinents et fournir des réponses structurées (sans que 
cela soit explicite, mais Juste à travers la présentation et la hiérarchisation des informations 
fournies à l'utilisateur). En conclusion, on peut dire que les moteurs de recherche, qui 
n'utilisaient pas de techniques de TAL à l'origine (ils procédaient «juste » par comptage de 
simples chaines de caractères), sont devenus des outils extrêmement puissants et intégrant 
des techniques de calcul complexes leur permettant de répondre de manière précise à des 
requétes variées, sous-spécifiées, dans une multitude de langues. 


7.2. La fouille d'opinion 


Les outils de fouille d'opinion sont sans doute moins connus du grand public que les moteurs 
de recherche et ils sont surtout moins accessibles. La fouille d'opinion est la tache qui vise 


72. Source de l' illustration : https://www.google.fr (visité le 22 août 2018). 
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à capturer, analyser et synthétiser les opinions exprimées en ligne sur un sujet donné ^. 
Nous connaissons tous des sites répertoriant des opinions sur des livres ou des films par 
exemple mais, au-delà, les industriels (quel que soit le secteur d'activité) sont tous à la 
recherche de synthéses des opinions et avis émis sur leurs produits. Or, ces avis peuvent 
étre exprimés dans des endroits fort variés (presse, forums en ligne, blogs, etc.). Les outils 
de veille visent en premier lieu à rassembler automatiquement toutes les apparitions d'un 
nom de marque ou de produit dans les textes accessibles en ligne (il s'agit donc, en gros, 
de moteurs de recherche spécialisés), puis les outils de fouille d'opinion permettent de 
compléter l'analyse en produisant une analyse des opinions exprimées dans ces textes. 

Il s'agit d'un marché important sur le plan économique et de nombreuses sociétés ont 
investi ce champ de recherche. Il est dès lors difficile de s’y retrouver, entre les entreprises 
qui se contentent d'identifier quelques adjectifs ou adverbes marqueurs de tendance 
dans les textes (en gros repérer «bon» ou «bien» vs «mauvais» ou «nul») et celles 
qui procédent à une analyse minutieuse du contenu textuel. Effectivement, sur le plan 
linguistique, l'analyse d'opinions peut étre fort complexe. Pour une analyse minutieuse, 
il faut non seulement identifier la nature de l'opinion (positive / négative / neutre, ou 
plus précisément que cela encore) mais aussi identifier la personne qui a émis l'opinion 
(la source de l'opinion), et ce sur quoi elle porte (la cible). Dans l'idéal, l'analyse devrait 
prendre en compte des éléments discursifs. Par exemple, dans « J'ai bien aimé le film, mais 
les acteurs ne sont vraiment pas bons», il y a une espéce de paradoxe entre l'évaluation 
positive du film et l'évaluation négative des acteurs. Il faut sans doute inférer que dans 
ce cas, c'est l’histoire ou la mise en scène qui était digne d’intérêt ; en tout cas, avoir une 
analyse fine du contenu exprimé exige des outils de traitement automatique des langues 
avancés. C'est justement ce qui est demandé en majorité par les utilisateurs de ces types 
de systèmes : les industriels cherchent en priorité à savoir quels aspects de leurs produits 
améliorer, et sont donc souvent intéressés par une analyse fine et précise du texte. 


7.3. La classification de documents 


La classification de documents est trés complémentaire des moteurs de recherche. Une fois 
qu'un moteur de recherche classique a identifié des pages Web pertinentes par rapport à une 
requéte, il peut chercher à les classer en fonction de leur contenu informationnel, afin de privi- 
légier par exemple des pages montrant différentes facettes d'un même évènement (autrement 
dit, si deux pages expriment un contenu jugé similaire, une seule sera montrée à l'utilisateur 
par défaut, la deuxième n'ayant pas d’intérêt vu qu'elle n'apporte pas d'information en plus). 

Les premiers outils d'accés à Internet (avant que Google ne révolutionne le domaine 
en proposant une simple fenétre de recherche trés dépouillée) étaient des «portails» ou 
des annuaires, proposant une classification hiérarchique des documents accessibles en 
ligne. L'utilisateur, au lieu de taper une requéte, pouvait parcourir l'information disponible 
en ligne, en naviguant au sein de l'annuaire mis à sa disposition. C'est ce qui a fait la 
fortune de Yahoo dans les années 1990, avant son déclin depuis le milieu des années 2000. 

Ce type de présentation est en apparence moins populaire aujourd’hui pour la recherche 
sur Internet, alors que tout un chacun accéde au Web à travers un moteur de recherche 
classique. Les portails d'actualité restent malgré tout des outils trés utilisés et fondés sur la 
classification de documents. Google Actualité par exemple «aspire» en permanence les 
textes d'actualité publiés en ligne par les médias (journaux, agences de presse, sites 
d'information en ligne), puis les classe par sujet et par importance. Si un sujet est important, 
le moteur identifie un texte principal (disponible à travers un lien et une ou deux phrases 


73. El-Béze et al. (2010) et Liu (2012). 
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Figure 10. Interface de Google Actualité (Google News en anglais) *. 


On voit (figure 10) que le moteur de Google ne se contente pas de collecter les informations 
sur les sites d'informations en ligne : il en fait une analyse automatique, permettant de 
classer les informations, de les hiérarchiser et surtout de lier entre eux les articles portant 
sur un méme sujet pour en mettre un en avant (normalement le plus pertinent, choisi en 
fonction de critéres qui ne sont pas connus publiquement; il est probable que le contenu et 
la source — c'est-à-dire le journal oü la nouvelle a été publiée — sont évalués conjointement). 


7.4. La traduction automatique 


Comme on l'a vu au début de cet article, la traduction est une application phare pour le 
traitement automatique des langues, pour plusieurs raisons : la táche est bien identifiée 
et facilement compréhensible par le grand public ; elle est extrémement complexe et 
recouvre en fait l'ensemble des problématiques du domaine du traitement automatique 
des langues ; enfin, elle répond à des besoins pratiques avérés ^. 

Les questions scientifiques soulevées par la traduction automatique ont été étudiées dans 
la première partie de cet article, il n’y a donc pas lieu d'y revenir. Tous les systèmes populaires 
et performants actuellement en ligne utilisent principalement l'approche neuronale (dite aussi 
«apprentissage profond» ou «deep learning») qui est, de loin, l'approche la plus performante 
aujourd’hui. Comparée à l'approche statistique classique, l'approche neuronale permet de 
traduire en prenant la phrase comme unité de base, ce qui évite d'avoir à assembler de manière 
un peu hasardeuse des fragments de textes qui ne sont pas toujours compatibles entre eux 
(approche statistique classique). Les performances sont correctes pour certaines langues 
(notamment les langues indo-européennes entre elles, mais aussi, et de plus en plus, le chinois 
qui bénéficie d'une trés grande attention, depuis plusieurs années, pour des raisons culturelles 
et économiques). La technologie a fortement progressé en quelques années et est maintenant 
mature pour une utilisation grand public, voire semi-professionnelle dans certains contextes. 


74. Source de l'illustration : https://news.google.com (visité le 22 aoüt 2018). 
75. Poibeau (2017). 
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Une source de progrés importante pour les années a venir consistera probablement a 
faire traduire un systéme automatique depuis une langue source vers une langue cible, 
puis a retraduire en sens inverse vers la langue source (a partir de la traduction obtenue 
automatiquement). On peut ensuite analyser les erreurs ou, au moins, les écarts entre le 
texte d'origine et le texte produit à l'issue des deux étapes de traduction. La nature de 
ce qu'un systéme peut inférer ainsi n'est pas claire, mais ce type de techniques a fait 
ses preuves dans d'autres domaines (par exemple, pour le jeu de go, des améliorations 
trés importantes ont été obtenues en faisant jouer des machines entre elles pour élaborer 
de maniére complétement autonome des stratégies nouvelles gagnantes, méme contre 
les meilleurs joueurs internationaux). La traduction automatique est évidemment trés 
différente du jeu de go, mais l’idée est bien de faire évoluer progressivement le système 
vers de bonnes traductions, de maniére complétement autonome, gráce à des milliers 
voire des millions d'essais. L'idée même de cette approche, les résultats possibles et les 
conséquences en termes de créativité et d'analyse du langage devraient normalement 
susciter de nombreux débats dans les années à venir. 


7.5. La correction orthographique et grammaticale 


La correction orthographique et grammaticale est une autre application trés populaire du 
domaine du traitement automatique des langues, du fait de l'intégration d'outils relati- 
vement performants dans tous les logiciels de traitement de textes grand public (Microsoft 
Word, Open Office, etc.). Le principe en est fort simple : il s'agit de repérer les «fautes» 
d'orthographe et de grammaire, en général dans un texte tapé en direct par un utilisateur. 

Les premiers systémes se contentaient de repérer les mots des textes à analyser qui ne 
figuraient pas dans un lexique de la langue visée. Les outils sont depuis longtemps devenus 
infiniment plus perfectionnés, et sont maintenant capables de reconnaitre avec un bon taux de 
succès de trés nombreuses erreurs, aussi bien les fautes d'étourderie en cours de frappe que 
des erreurs plus complexes comme des problémes d'accord du participe passé (figure 11). 
Évidemment, ces outils ne sont pas infaillibles : ils commettent encore de nombreuses erreurs 
et ne parviennent pas à identifier certaines erreurs complexes (et parfois d'autres, plus simples). 


[È « Exemple de texte bilingue.docx » - Correcteur - Antidote - SEN) 
Fichier Édition Outils Correcteur Fenêtre Aide 
YO «>» A -a23^A|B-B- 
[IE Document Microsoft Word Langue + 52 % français, 48 % anglais Mon usage... 
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€) tangue hres dans notre logement pour commémorer le 10ème anniversaire de mariage du x ia F 
" = h : , poo CMM eme 4 samedi le samedi 
@ Typographe (3 neveu de la directrice de la cousine du coiffeur du maire. Ce dernier n'a pas encore ne ee 
Q style [5] confirmer sa présence à la féte, mais, quoiqu'il fasse, il serait agréable que vous et vos rhone 0 
4 Révision bambins se joignez à notre féte, sans compter que ce sera pour vous une opportunité confirmer confirmé 
N © Pragmatique > |.) de faire la connaissance de notre famille. Comme le disait Confucius, "Plus on est de quoiqu' quoi qu’ 
© sémantique > fous, plus on rit!" se vous 
o Lexique > joignez joigniez 
" n «| Anglais 
© Logique > = We intend to have a party Saturday, november 6, in our appartment. We will celebrate a = y: p 
= " 5 - £ = > E E saturday riday 
4 Statistiques the 10 years weddng era of the mayor's hairdresser's cousin s boss’ nephew. ovest Nddber 
69 Tailles > He didn’t told us if he is is coming, but whatever happens, we are delighted to throw appartment apartment 
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@ regroupements > an opportunity to meat our siblings. As it have been mentionned by the chinese boss' boss's 
® Mots > renowned philosopher Confucius, « The more, the merryer. » told tell 
® Étymologie > isis is 
-— = inin to ioin x 
| 10phrases 184 mots 1010 caractères 25 détections | 


Figure 11. Un correcteur orthographique et grammatical (ici, le système Antidote”). 


76. Source de l' illustration : https://applications.developpez.com/actu/85501/ (visité le 22 janvier 2019). 
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La mise au point de ce type d'outils est, comme on peut l'imaginer, trés complexe. 
Il faut formaliser l'ensemble de la grammaire, l'ensemble des contraintes sur les mots, 
repérer les erreurs sans trop «sur-générer » (c'est-à-dire sans repérer des erreurs là où il 
n'y en a pas). La táche est déjà complexe quand il s'agit de mots inconnus (ou du moins, 
ceux qui ne sont pas inclus dans le dictionnaire de l'application) mais elle devient trés 
difficile au niveau syntaxique du fait des nombreuses ambiguités dans la langue. Les 
concepteurs de tels logiciels (par exemple Synapse en France) utilisent de trés grandes 
bases de fautes et d'erreurs. Pour chaque nouvelle version de leur logiciel, ils doivent 
s'assurer que davantage de fautes sont repérées, mais que le logiciel ne repére pas à tort 
de nouvelles fautes ou, plus important encore, n'oublie pas des fautes qui étaient repérées 
avant. Vu le nombre de cas à considérer (et le nombre de règles locales, potentiellement 
contradictoires entre elles), la tache est trés délicate. 


7.6. Les applications d'apprentissage en ligne 


Par «apprentissage en ligne », on désigne tous les sites et les applications en ligne ayant 
pour but de transmettre de nouvelles connaissances. Certaines de ces plateformes n’intégrent 
pas du tout de techniques de traitement automatique des langues, mais d'autres ont placé 
le TAL au cœur de leurs préoccupations. 

On pourra citer deux exemples. Les entreprises qui proposent des tests de langue (en 
ligne ou non) et qui essaient toutes de développer des applications capables de «noter» 
automatiquement la production d'étudiants soumettant des textes écrits "". La correction 
de ces textes est une tache relativement longue : les formations sont donc relativement 
coûteuses et mobilisent de trés nombreux correcteurs. Les tests corrigés automatiquement 
en ligne seraient sans doute moins fiables, mais permettraient aux étudiants de soumettre 
plus de textes pour un coüt moindre et d'améliorer ainsi la qualité de leur rédaction 
(ce qui n'empécherait bien stir pas de passer par un correcteur humain aussi de temps 
en temps, en complément). Ce type d'application entretient donc des liens évidents 
avec la correction orthographique et grammaticale, à ceci prés que les erreurs produites 
peuvent étre trés différentes de celles de locuteurs natifs. Une adaptation des systémes à 
la táche visée, et notamment la reconnaissance des fautes les plus courantes en fonction 
de la langue source, sont des facteurs clés pour la réussite de ce genre d'applications. Il 
s'agit à l'heure actuelle d'un domaine de recherche très actif, à la frontière du TAL, de 
la linguistique et de l'enseignement des langues. 

L'autre exemple concerne la mise en ligne de ressources pour l'apprentissage. Par 
exemple, l'université de Tromse a développé de nombreux outils pour des langues peu 
répandues, notamment les langues finno-ougriennes comme le same (figure 12). On trouve 
ainsi en ligne une multitude d'outils, gratuits, qui permettent à l'utilisateur d'apprendre 
la langue de facon interactive et ludique. 

Le same a en particulier une morphologie extrémement complexe, ce qui rend parfois 
la recherche d'un mot dans le dictionnaire trés problématique pour le débutant. Une 
application en ligne permet de résoudre ce probléme : l'utilisateur soumet une forme 
complexe, et la machine donne alors l'analyse (ou les analyses si la forme est ambigué), 
ce qui est extrémement utile. De telles applications existent pour de nombreuses langues, 
de maniére plus ou moins développée et plus ou moins fiable, mais il s'agit d'un enjeu 
majeur pour les langues rares et les langues en danger notamment. 


77. Díaz-Negrillo et al. (2013). 
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Figure 12. Porte d'accés à la plateforme de ressources 
pour l'apprentissage du same en ligne #. 


7.7. Reconnaissance et synthése vocale 


La reconnaissance vocale est un domaine qui a évolué trés rapidement ces dernières 
années”. Rappelons qu'il s'agit, à partir d'un flux audio (c'est-à-dire, en général, d'un flux 
de paroles), de produire une transcription écrite aussi précise que possible. Les techniques 
de transcription sont purement numériques et n’intègrent quasiment pas de connaissances 
linguistiques, on n'en dira donc pas plus ici. On peut juste rappeler qu'il y a encore une 
vingtaine d'années, les systémes étaient «monolocuteurs » et nécessitaient une phase 
d'entrainement (c'est-à-dire que chaque utilisateur devait en pratique prononcer 100 ou 
200 phrases de manière très distincte pour que le système s'adapte à sa voix — en fait, 
adapte ses paramètres à la voix à reconnaitre — pour ensuite pouvoir transcrire avec une 
qualité acceptable). Aujourd'hui tout un chacun peut commander à la voix son téléphone 
portable sans phase d'entrainement et le systéme reconnait généralement relativement 
correctement les commandes formulées par les utilisateurs. 

La transcription pure (obtention d'un texte à partir d'un signal audio) est trés employée, 
depuis longtemps, dans certains domaines comme le droit ou la médecine (les avocats ou les 
médecins enregistrent leurs commentaires qui sont transcrits automatiquement dans un fichier 
informatique). La transcription est aussi utilisée pour sous-titrer automatiquement et en direct 
certains événements (notamment pour les chaines d'information en continu, diffusées dans 
les gares et les aéroports, sans le son). En dehors de ces cadres d'application particuliers, 
la transcription écrite n'est pas visible et tout se fait de facon vocale et transparente pour 
l'utilisateur. C'est notamment le cas des systémes de commande sur téléphone portable : 
recourir à la commande vocale évite d'avoir à taper sur le clavier, ce qui, dans certains cas, 
peut être très pratique. Il n'y a alors pas de transcription «visible», mais la commande est 
bien transcrite en texte pour pouvoir ensuite étre traitée par le systeme. 


78. Source de l'illustration : http://kursa.oahpa.no (visité le 22 aoüt 2018). 
79. Haton (2016). 
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L'application complémentaire en quelque sorte est la synthèse vocale. La synthèse 
vise à transmettre oralement un message généralement stocké sous forme écrite (ou alors 
produit à la volée à partir d'une base de données). La transcription fonctionne de mieux 
en mieux et est trés utile dans de nombreux contextes, notamment pour les aveugles qui 
souhaitent se passer du braille. 


7.8. Commande vocale, dialogue humain — machine et agents conversationnels 


Les applications intégrant des agents conversationnels constituent un des domaines phares 
du traitement automatique des langues aujourd’hui, en particulier dans le domaine de l'aide 
et du «support utilisateur» (c'est-à-dire les applications d'aide aux utilisateurs de systémes 
informatiques ou de service en général). Avoir un agent conversationnel, c'est-à-dire souvent 
un personnage à l'écran figurant un opérateur répondant à des questions, aide visiblement les 
utilisateurs de ce type de service à s'identifier et à ne plus avoir l'impression de parler 
simplement à une machine", La personnification joue à plein et les études qualitatives montrent 
un vrai engouement pour ce type d'applications, les utilisateurs y voyant tantót un cóté ludique, 
tantót un cóté humain bien qu'il n'y ait là rien de véritablement humain (figure 13). 


* Inés, à votre disposition 


Bonjour et bienvenue au Club 
Nespresso. Je m'appelle Inés et je 
vous propose de vous aider sur 
notre site. 

Quelle est votre question ? 


Posez votre question ici 


Mode d'emplo 


Figure 13. Un agent intelligent 
(répondant à des requêtes pour la marque Nespresso) !. 


L'utilisateur peut taper ses questions dans une boite de dialogue et la réponse est fournie 
par le petit personnage, ce qui permet de «personnifier» le dialogue avec la machine 
(et de faire disparaitre la machine aux yeux de l'utilisateur). 

Sur le plan technologique, ce type d'application améne à gérer des aspects dialogiques 
souvent non triviaux. Si l'on veut que le systéme soit pertinent et évolué, il faut qu'il 
ait un minimum de contexte et de mise en mémoire, au moins pour résoudre certains 
pronoms simples. Si l'on prend le premier exemple (fictif) : 


80. Landragin (2013). 
81. Source de l'illustration : https://www.nespresso.com/fr/fr/service-customer-care (visité le 22 août 2018). 
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— Quelle est la capitale des Etats-Unis? 

— D’aprés Wikipédia, la capitale des Etats-Unis est Washington. 
— Et celle de la France? 

— La capitale de la France est Paris. 


Ce dialogue peut sembler relativement simple, mais le systéme doit inférer que le pronom 
«celle» dans la 3* prise de parole correspond au mot «capitale», qui figurait juste au- 
dessus. Il s'agit d'un cas relativement simple à gérer, mais cela n'est pas trivial quand 
on est hors domaine (c'est-à-dire quand le systéme doit faire face à des requétes pouvant 
porter sur n'importe quel domaine, et n'est pas limité à une application simple, définie a 
priori, comme dans le cas d'un agent intelligent répondant à des requétes sur des capsules 
de café). Les systémes les plus avancés sont capables de gérer des cas de coréférence 
plus compliqués que celui donné en exemple. 
On prendra encore un autre exemple : 


— Qu'est-ce que la c-commande d'aprés Chomsky ? 
— Désolé, je ne sais pas répondre à cette question. 


Ici, le systéme a été capable de détecter que la question était trop complexe. Ce type de 
situation est délicat à détecter en pratique car les systémes fonctionnent essentiellement 
par mots clés : la question est transformée en requéte, c'est-à-dire en un ensemble de 
mots clés et un moteur de recherche trouve quasiment toujours des documents contenant 
les mots clés recherchés. Partant de là, analyser les documents retournés par le moteur 
et identifier qu'aucun ne répond vraiment à la question est un probléme extrémement 
difficile. Les gadgets commandés à la voix se mettent souvent à «réciter» une notice 
Wikipédia quand la question n'a pas été comprise, en pariant sur le fait que la notice 
contiendra au moins une information pertinente. 

Cette situation est en fait un peu la situation courante. Un système informatique n'a pas 
de «conscience» : un systéme de dialogue ou un agent conversationnel (tout comme, d'une 
certaine facon, un moteur de recherche) ne font que mettre en avant des documents qui sont 
susceptibles de répondre à une question, selon des critères statistiques. Chaque géant de l'Internet 
a développé son propre système : Siri chez Apple, Alexa chez Amazon, Ok Google, etc. 


8. LE TRAITEMENT AUTOMATIQUE DES LANGUES AU SERVICE D’AUTRES DOMAINES : 
DES HUMANITÉS NUMÉRIQUES À L'ANALYSE DE GRANDS CORPUS 


Le TAL n'est pas simplement un domaine tourné vers les applications « grand public». 
Le monde de la recherche peut aussi en bénéficier, dés que de grandes masses de données 
textuelles sont manipulées. 


8.1. Le TAL au service de la recherche en lettres et sciences sociales 


Ainsi, les chercheurs en lettres et surtout en sciences sociales sont passés brusquement 
d'une situation de pénurie de données ou, du moins, d'une situation ou les données étaient 
souvent difficiles à assembler, à une situation où les données sont apparemment massives, 
disponibles et faciles d’accés. Les sciences sociales sont les premières concernées : si, 
par nature, les recherches en lettres portent sur des corpus particuliers, ayant fait l'objet 
d'une édition critique minutieuse, tel n'est pas toujours le cas des recherches en sciences 
sociales qui s' intéressent souvent à une réalité plus immédiate et à des témoignages 
directs. Internet est dans ce cadre une source d'information qui ne peut étre ignorée. Or, 
malgré des bénéfices certains, cette masse de données soulève de nombreux problèmes : 
la plupart du temps, les données ne sont pas directement exploitables, elles doivent étre 
triées, filtrées, organisées ; elles reflètent des points de vue particuliers qui ne sont pas 
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obligatoirement ceux qui sont visés par le chercheur en lettres ou en sciences sociales; 
enfin, elles peuvent étre partielles ou biaisées. 

Effectivement, comme on l'a vu, un texte ne saurait étre assimilé à une masse de 
connaissances directement exploitable par la machine. Il faut dans un premier temps 
prévoir des traitements complexes pour identifier l'information pertinente, la normaliser, 
la catégoriser et éventuellement la mettre en contexte. Alors seulement l'ordinateur ou 
l'expert sera capable d'en tirer parti pour mener à bien ses analyses. Mais comment 
procéder pour extraire l'information pertinente de la masse textuelle ? Quels outils utiliser ? 
Pour quelle pertinence? Ces questions sont ouvertes et n'ont pas de réponse immédiate et 
évidente : on présentera ici un apercu rapide des techniques et des possibilités actuelles, 
issues des techniques développées et décrites dans les sections précédentes. 

Plusieurs études ont pointé la frustration des chercheurs en lien avec ce probléme : les 
textes sont effectivement là, présents et disponibles sur la Toile, mais leur exploitation reste 
difficile. Elle exige la collaboration de spécialistes de différents horizons, capables de traiter 
les données, de fournir les outils pour extraire l'information pertinente et d'ajuster de manière 
collaborative les traitements. Idéalement, l'exploitation des données disponibles sur la Toile 
dans le domaine des sciences humaines et sociales nécessiterait la mise en place d'équipes 
pluridisciplinaires mais cela reste rare et difficile, du fait de la spécialisation de plus en plus 
grande des recherches ainsi que des intéréts divergents des différentes disciplines. Il est en 
effet difficile de définir un projet de recherche à la fois innovant dans le domaine du traitement 
de l'information et dans le domaine des sciences sociales. Il est alors nécessaire d'avoir 
recours à des unités de service, qui pourront par exemple fournir les «bons» traitements aux 
chercheurs en sciences sociales en utilisant une combinaison d'outils existants, sans qu'il 
y ait forcément une dimension fondamentalement nouvelle dans les traitements effectués. 


8.2. Quelques exemples de réalisation 


Les applications du traitement automatique des langues sont nombreuses et il est impossible 
d'en donner un panorama complet. Nous présentons ici quelques exemples récents, qui donnent 
une idée de la variété des applications visées et surtout les types de représentation possibles. 
Vu la masse de données à traiter, il est en effet important de prévoir pour les utilisateurs, en plus 
des analyses automatiques, des formats de présentation qui soient lisibles, utiles et informatifs. 

Une application classique est par exemple le suivi d'un fil d'agences de presse. Les agences 
de presse produisent chaque jour des textes sur l'actualité, en plus ou moins grand nombre 
suivant l'événement, son importance et son évolution. Des modules d'analyse traditionnels 
peuvent permettre d’extraire les entités nommées, de classer les dépêches d’après les entités 
qu'elles contiennent, d'extraire d'autres informations plus précises en fonction du sujet traité 
et d'obtenir des courbes permettant d'observer le volume d'informations traité au cours du 
temps sur un pays, un personnage ou un évènement. Des systèmes multilingues permettent 
en outre de suivre simultanément plusieurs fils d'agences de presse, et de comparer la 
couverture d'un méme événement dans plusieurs pays par exemple. 

Les techniques utilisées sont le repérage d'entités nommées, l'analyse de la coréférence, 
et éventuellement une analyse syntaxico-sémantique peut étre effectuée si des éléments 
précis de la dépêche doivent être extraits. Dans l'exemple donné en figure 14%, les 
auteurs de déclarations politiques ainsi que le contenu de leur déclaration est extrait 
automatiquement, ce qui implique le repérage et a minima une analyse syntaxique locale 
des prises de parole dans les différentes dépéches. 


82. Poibeau (20142). 
83. Id. (2003). 
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Figure 14. Un système d'analyse et de suivi en direct d'un fil d'agences de presse “ 


Chaque dépéche est analysée (les entités nommées notamment), des informations sont 
extraites dynamiquement des dépéches (par exemple les déclarations politiques ou les scores 
pour les résultats sportifs) et un suivi temporel des thémes abordés est également offert. 

Le traitement automatique des langues a fait son apparition dans le monde journalistique 
depuis plusieurs années maintenant. Au-delà de l'analyse du contenu classique, on 
remarquera des enjeux importants comme la détection de fausses nouvelles (fake news), 
mais il s'agit d'une táche trés complexe et sans doute inatteignable pour bien des années 
encore : par définition une fausse nouvelle est rédigée comme s’il s'agissait du compte 
rendu d'un vrai évènement. Il faudrait donc pouvoir vérifier l'information et la mettre 
en rapport avec d'autres sources, en direct, ce qui est trés largement au-delà de l'état de 
l'art. C'est d'ailleurs toute la difficulté du repérage des fausses nouvelles, même quand ce 
sont des humains qui s'y penchent, d'autant qu'une fake news est rarement entièrement 
fausse, il y a souvent un arrière-plan réaliste ou factuel qui rend d'autant plus difficile le 
repérage de la partie fausse du récit ou de la dépéche. 

La classification et la visualisation de grands corpus sont une autre application classique. 
Les techniques utilisées sont moins linguistiques que lors de l'analyse d'un fil d'agence 
de presse : il s'agit avant tout de repérer les termes techniques pertinents dans un domaine 
donné, de les regrouper en classes sémantiques éventuellement hiérarchisées les unes 
par rapport aux autres. On peut ainsi analyser par exemple la production d'un domaine 
scientifique. Sur quoi les chercheurs travaillent-ils ? Quels sont les liens entre chercheurs, 
entre institutions, entre pays? Le graphe de la figure 15 offre ainsi une représentation 
du domaine de la linguistique informatique : chaque cercle identifie un sous-domaine 
scientifique tel qu'il a été repéré automatiquement. 


84. Source de l' illustration : Poibeau (2003). 
85. Omodei et al. (2014). 
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Figure 15. Modélisation d'un domaine scientifique : le traitement automatique des langues 
vu à un niveau macroscopique. Chaque cercle correspond à un sous-domaine particulier *°. 


Le travail d'interprétation et d'évaluation consiste à vérifier si les analyses automatiques 
(les groupements de chercheurs, les grands domaines de recherche) correspondent aux 
ensembles connus ou non. L'analyse peut soit confirmer des hypothéses anciennes, soit 
produire de nouvelles connaissances en révélant des liens inattendus, des collaborations 
ignorées jusqu'ici, etc. Ce type de technique est très utilisé dans l’industrie pour la veille 
technologique par exemple. 

Les outils de visualisation sont devenus des éléments essentiels pour l'analyse ces 
derniéres années. Devant la masse de données à traiter, il est indispensable de disposer 
d'outils permettant à la fois d'en avoir une vue globale et de pouvoir «zoomer» pour 
observer plus en profondeur certaines parties particuliérement intéressantes d'une carte 
ou d'un graphe. 

Des représentations particuliérement intéressantes rendent compte d'un fait en fonction 
du temps (figure 16) : l'évolution d'une forme linguistique, des thémes traités dans un 
corpus ou d'un événement particulier. De trés nombreux outils sont disponibles pour cela, 
qu'il faut bien sir adapter en fonction du domaine et du corpus traités. 


86. Source de l'illustration : Omodei et al. (2014). 
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Figure 16. Suivi temporel de l’évolution d’un domaine scientifique au cours du temps (ici, le TAL). 
Chaque colonne correspond à une tranche de temps et la carte montre l’importance relative 
et l'évolution des différents sous-champs du domaine au cours du temps ?". 


9. CONCLUSION 


Dans ces quelques pages, nous avons essayé de donner une image aussi complete et aussi 
diversifiée que possible du trés vaste domaine du traitement automatique des langues. 
Nous n'avons bien sûr pas pu détailler la richesse de ce domaine né il y a maintenant 
plus de 70 ans, avec l'apparition des premiers ordinateurs. Le but de ce texte est avant 
tout de donner des points d'entrée dans ce domaine, et le lecteur pourra ensuite lire des 
ouvrages plus spécialisés sur chacun des points abordés. Il existe en effet une littérature 
riche sur chaque aspect évoqué ici : aspects théoriques ou plus applicatifs du domaine, 
aspects historiques ou contemporains, commerciaux ou non. 

Le lecteur l'aura sans doute senti à la lecture de ce texte : le domaine est aujourd’hui 
trés peu «linguistique » et les techniques d'analyse sont avant tout informatiques. Elles 
reposent essentiellement sur l'analyse statistique de gros corpus par des réseaux de 
neurones et, pour simplifier, sur une approche distributionnelle généralisée qui permet 
de retrouver des configurations linguistiques typiques (qu'il s'agisse de syntaxe ou de 
sémantique). C'est pourquoi le célèbre «slogan» de Firth est éternellement cité et repris 
dans le domaine du traitement automatique des langues et de la linguistique de corpus : «on 
connaît un mot par son contexte » (« You shall know a word by the company it keeps 95»). 

Au-delà des aspects pratiques et des performances observées, l'approche statistique 
semble intéressante dans la mesure où elle souligne la force de certains éléments connus mais 
trop souvent sous-estimés en linguistique. On peut ainsi citer la nature fondamentalement 
statistique — on pourrait méme dire «zipfienne» — des langues (du lexique, bien entendu, 
mais aussi de la grammaire) ou le caractère continu de la sémantique (au sens où les mots 
sont plus ou moins proches sémantiquement les uns des autres — ceci vaut aussi pour la 
notion de paraphrase). À l'inverse, cette approche semble aussi montrer l'inadéquation des 
modes de représentation logiques, souvent trop rigides au regard de la plasticité de la langue. 
L'ambiguité n'est pas en soi un probléme qui devrait étre corrigé (ou qui ne peut étre résolu 


87. Source de l' illustration : Omodei et al. (2014). 
88. Firth (1957 : 11). 


Le traitement automatique des langues : tendances et enjeux 61 


qu'à travers l'élaboration de listes infinies); c'est en fait le reflet de différents usages des 
mots dans différents contextes. Chaque contexte est particulier mais il est possible d'identifier 
des cas d'usages réguliers par généralisation, ce que les statistiques font très bien ®. 

Il nous semble qu'il y a toutefois au moins deux limites à cette approche statistique. 
D'une part, comme nous l'avons déjà souligné, le fait que le contexte pris en compte par 
les algorithmes actuels reste limité; définir le contexte idéal, sa nature et son contenu, 
reste un probléme entier. D'autre part, le langage est affaire d'usage et par définition, le 
texte est un objet figé qui exclut tout le contexte communicationnel extralinguistique. 
Il est douteux que l'ensemble des connaissances nécessaires au traitement automatique de 
la langue puisse étre inféré automatiquement et directement à partir de corpus, méme si 
ceux-ci se composent de milliards de mots. C'est d'ailleurs en partie pour répondre à ce 
probléme que les systèmes statistiques cherchent de plus en plus à intégrer des ressources 
linguistiques prédéfinies, méme s’il faut ensuite s'assurer de la cohérence de ces données 
avec celles des modèles statistiques. Il y a là un champ de recherche à part entière. 

Pour conclure, il faut enfin souligner que ces remarques concernent essentiellement 
la sémantique lexicale (la sémantique des mots, par opposition à la sémantique d'unités 
supérieures comme la phrase ou le texte). Peu de systémes actuels intégrent une analyse de 
la structure des phrases complexes et des liens entre phrases. Quand ces mémes systémes 
doivent aussi produire des textes (que ce soit dans le cadre de la traduction ou du résumé 
automatique), le résultat est souvent un ensemble de phrases juxtaposées, sans lien clair 
entre elles ni progression logique. Il reste donc un travail important à faire au niveau 
textuel pour améliorer l'analyse et la génération de textes. À ce propos, Kenneth Church, 
dans un article de 2011, regrette le fait que les approches statistiques appliquées au TAL 
ont jusqu'ici ramassé les « fruits les plus faciles à atteindre » (l'expression «/ow hanging 
fruits» est devenue trés populaire dans le domaine pour désigner les problémes les plus 
abordables). Il existe cependant de nombreux fruits plus difficiles à atteindre, qu'on 
ne pourra plus ignorer quand les tâches les plus faciles auront été résolues de manière 
raisonnable. Il n'est alors pas évident que les statistiques suffiront. 
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CONVERGENCES ET DIVERGENCES 
AU SEIN DU BOSNIAQUE-CROATE-MONTENEGRIN-SERBE 


Marijana PETROVIC 


RESUME 

Les convergences et les divergences en BCMS (bosniaque-croate-monténégrin-serbe) sont un 
processus dynamique à travers l'histoire, et ce jusqu'à aujourd'hui. Issu du slave méridional, le 
serbo-croate a connu plusieurs standardisations au x1x° siècle avant de devenir l'une des langues 
officielles de la Yougoslavie. Mais l'éclatement de celle-ci a donné naissance à quatre standards, 
qui, bien que selon des modalités différentes, répondent cependant tous à la méme volonté d'une 
construction identitaire et étatique, d'où le paradoxe d'un seul et méme système linguistique avec 
quatre noms de langues. La recherche d'une pureté imaginaire de la langue installe une insécurité 
linguistique qui, in fine, s'avère contre-productive. 


ABSTRACT 


Convergence and divergence in BCMS (Bosnian-Croatian-Montenegrin-Serbian) are a dynamic 
process throughout history until today. Serbo-Croatian, which comes from meridional Slavic, 
has known several standardisations in the xix" century, before it became the official language 
of Yugoslavia. However, the splitting of Yugoslavia gave birth to four standards, which, through 
different means, answer the same goal: construing an identity and a state. Hence the paradox of 
one and the same linguistic system having four language names. The quest of an imaginary purity 
of the language generates a linguistic insecurity which, in the end, is counterproductive. 


La Yougoslavie fut sans conteste un grand pays : elle participa activement au lancement 
du Mouvement des non-alignés, et Tito a été représenté sur des billets de banque en 
Afrique. Elle fait l'objet de beaucoup de recherches et de critiques, que ce soit en droit, 
en économie ou en sciences politiques, que ce soit pour mettre en valeur certaines idées 
jugées belles ou, au contraire, pour en montrer les limites et pointer le manque de libertés. 
Son rayonnement et son prestige n'occultent en rien l'existence de Goli Otok, une ile 
transformée en bagne, ou l'élection d'un président à vie. La Yougoslavie fait couler 
beaucoup d'encre, et des étudiants belges, espagnols, israéliens, frangais et beaucoup 
d'autres s" intéressent aussi bien à ce qu'elle a apporté comme modèle positif qu'à l'horreur 
produite par son éclatement. Pourquoi la Yougoslavie a-t-elle éclaté ? Les réponses peuvent 
étre de différents ordres, économiques d'abord, certes, mais aussi politiques, sans parler 
des enjeux religieux et globaux. 

Dans un chamboulement social de cette ampleur, la langue subit naturellement des 
changements profonds, puisqu'elle est également un miroir de la société. La Yougoslavie 
possédait trois langues officielles, le slovène, le macédonien et le serbo-croate (ou croato- 
serbe, avec ou sans trait d'union). Celui-ci a été principalement standardisé au cours du 
XIX* siècle à partir du dialecte Stokavien (Sto : « quoi») jékavien (selon la prononciation 
du e). Les quatre républiques fédératives où le serbo-croate était parlé sont devenues 
maintenant des pays indépendants : la Bosnie-Herzégovine, la Croatie, le Monténégro 
et la Serbie. Mais aucun consensus n'a été trouvé pour désigner cette langue toujours en 
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usage dans ces pays. Le passage du xx° au xxr' siècle a vu naître de nouveaux États, mais, 
lorsqu’un nouvel Etat est créé, se pose la question de la langue. Quelle langue officielle, 
quelle langue standard? Et ne faut-il pas plusieurs langues officielles? La langue est-elle 
alors un trait identitaire ? Ou est-elle plutót un outil politique ou un pouvoir en soi? 
La langue sert-elle le pouvoir? Dans ce cas, lequel? Si la langue appartient à tout locuteur, 
est-elle pour autant un objet démocratique ? 

La langue fait l'objet de débats entre les quatre pays, mais aussi entre les linguistes. 
Les grammairiens qui établissent les standards auront pour revendication une langue pure, 
unique, qui ne serait pas partagée par les voisins. Mais, pour les linguistes spécialistes de 
cette aire, le débat se situe ailleurs, car il ne fait aucun doute qu'il s'agit du méme systéme 
linguistique. Comment le désigner? Deux positions s'affrontent : certains souhaitent 
garder l'ancienne dénomination, «serbo-croate », comme Snježana Kordié ; d'autres, 
comme Paul-Louis Thomas, utilisent désormais l'acronyme BCMS, pour «bosniaque- 
croate-monténégrin-serbe », que j'adopte par respect pour les locuteurs qui décident eux- 
mémes de nommer la langue qui leur appartient comme ils le souhaitent. Si personne ne 
conteste le droit à l'autodétermination de ces peuples, un grain de sable s'est néanmoins 
glissé dans les rouages de la construction de la nation, car l'un des outils symboliques 
qui contribue à sa fondation est la langue, qui pourtant est de facto commune aux quatre 
États, malgré les efforts des uns et des autres pour la faire se différencier en plusieurs 
langues. Quelles sont donc ces dynamiques qui créent des convergences et des divergences 
au sein du BCMS ? Comment nommer cette langue? Est-il possible de trouver un accord 
pour nommer cette langue? La question sera d'abord traitée sous un angle historique, 
des grandes étapes de la constitution de la langue à l'éclatement de la communauté de 
ses locuteurs, avant d'examiner concrétement sa situation linguistique et dialectale. Nous 
verrons dans la troisiéme partie, à travers la Déclaration de la langue commune et les 
réactions qu'elle a suscitées, que ces enjeux de dénomination de la langue, loin d'étre 
seulement linguistiques, ont des retombées politiques et sociales. 


1. CONVERGENCES ET DIVERGENCES AU SEIN DU BCMS À TRAVERS L'HISTOIRE 


1.1. Les Slaves méridionaux 


Les Slaves ont migré entre le v? et le vi siècles. Trois groupes commencent alors à se 
distinguer : les Slaves orientaux, occidentaux et méridionaux, ce qui a pour conséquence 
«l'éclatement du slave commun ! », avec l'apparition au fur et à mesure de différents 
dialectes (dès les 1x° et x° siècles), ce qui n'empéche pas l'intercompréhension. Le slave 
méridional, amplement installé sur la péninsule balkanique, est composé d'un groupe 
oriental constitué du macédonien et du bulgare, et d'un groupe occidental constitué du 
slovéne et du serbo-croate?. C'est dans ce contexte qu'apparait le vieux slave : Cyrille et 
Méthode utilisent leur dialecte de Thessalonique, le macédonien, pour initier la traduction 
des textes sacrés, que leurs disciples ont adaptés au dialecte morave, occidental. Dans 
les Balkans, le vieux slave (qui a donné naissance au bulgare et au macédonien) est écrit 
en glagolitique, alphabet nouveau qui aurait été inventé par Cyrille et qui sert dans la 
tradition macédonienne d'Ohrid. Le glagolitique est le plus ancien alphabet slave. Il est 
en concurrence avec le cyrillique, inspiré de l'alphabet grec et du glagolitique, et qui est 
utilisé dans la tradition bulgare. Ce sont les premières attestations du slave, qui servent 
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à traduire les textes religieux depuis le grec?. Mais à partir du x1° siècle, on parle déjà 
du slavon, langue qui sert principalement à la liturgie, avec l'apparition de nouvelles 
variantes locales qui demandent une réappropriation de l'orthographe et de la grammaire : 
le slavon morave, le slavon russe puis, à partir du xir siècle, le slavon croate et serbe‘. 

Plusieurs monastéres deviennent des centres intellectuels, avec leurs propres 
codifications, créant des écoles, dont celles de RaSka puis de Resava. Auparavant, il y 
a eu aussi une première tentative de codification connue en Zeta, Hum et Bosnie?. La 
codification principale du serbe du Moyen Age a été faite sous le régne des Nemanjié 
à Raška; cette orthographe caractérise les écrits des xii et xiv* siècles. Saint Sava, ou 
Rastko Nemanjié, frère du roi, est le fondateur de l'église autocéphale serbe. Devenu 
moine, il crée cette première codification dans laquelle il rédigera en particulier des 
hagiographies, dont celle de Saint Siméon, son pére, la premiére écrite dans le domaine 
serbe. Je n'entrerai pas dans le détail de toutes les variétés de «slavon » qui se sont 
développées par la suite, avec notamment une forte influence du russe à certaines époques, 
en particulier au xvii siècle. Je rejoins ici Kordić” qui, après avoir avancé l’idée que les 
«oublis sélectifs » sont des facteurs importants dans la construction d'une identité, rappelle 
qu'il n'y a pas de continuité dans les histoires des peuples de cette aire géographique. 
Ainsi, les noms de peuples « Croates» ou « Serbes » ont un sens différent aujourd’hui, et 
s'utilisaient en parallèle avec d'autres, comme les « Slavons» ou encore les «Illyriens ». 

Ainsi, la langue littéraire de Dubrovnik? a-t-elle été appelée indifféremment «dubrovački», 
«naški», «slovinski», «ilirski», «lingua serviana» ou encore «croate». Dubrovnik fut une 
ville-république de 1358 à 1808, date à laquelle elle fut annexée par Napoléon. Son activité 
principale était le commerce, car la ville est un port important sur la mer Adriatique. À Raguse, 
qui deviendra Dubrovnik, on a aussi parlé un dialecte roman, le dalmate ragusain. Ensuite la 
ville s'est trouvée au point de rencontre du éakavien, qui avait une tradition littéraire, et du 
Stokavien d' Herzégovine, parlé dans les montagnes qui dominent la ville. Les habitants de 
la ville parlaient donc plusieurs langues, le Stokavien jékavien (un dialecte serbo-croate où le 
yat, ro, se prononce [je]) mais aussi le dalmate (langue de l’élite et de l'aristocratie), le latin 
et l'italien. Les premiers témoignages écrits remontent au xir siècle, mais les textes les plus 
importants furent rédigés à l'époque de la Renaissance, sous l'influence de la toute proche 
péninsule italienne. Le corpus est trés important, composé aussi bien d’ceuvres littéraires 
en prose ou en vers que de textes religieux ou de documents privés comme des lettres ou 
des documents administratifs. Les alphabets utilisés furent nombreux : le glagolitique, le 
latin, mais aussi la bosancica, appelée aussi cyrillique occidental. 

En fait, le vieux slave puis le slavon servent surtout à des textes écrits, ecclésiastiques, 
érudits ou littéraires, émanant de l’élite, tandis que la langue populaire évolue en parallèle, 
indépendamment. Le serbo-croate est de facto un exemple parmi d'autres d'une évolution en 
diglossie, de séparation entre une classe privilégiée qui a accés à l'éducation et à l'écriture, 
usant d'une langue souvent artificielle, et le peuple, dont le vernaculaire évolue avec le 
temps. Cette situation prévalait jusqu'aux codifications opérées au xix? siècle de façon 
conjointe en serbe et en croate. Au siècle des Lumières succède le Romantisme qui valorise 
les traditions populaires. La langue devient un moyen d'unir les peuples slaves, dans un 
contexte politique ou ils se trouvent pris entre les empires austro-hongrois et ottoman, aux 
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intéréts divergents et en conflit permanent. Les Autrichiens avaient effectivement intérét 
à ce que ces Slaves du sud, aux abords de leurs frontières, se rapprochent et codifient 
leurs langues. C'est dans ce contexte que nait ce mouvement convergent des Slaves du 
sud. Ils ont par ailleurs intérét aussi à les éloigner de l'influence russe, relayée notamment 
par le clergé orthodoxe. 


1.2. Les Slaves du sud 


C'est dans ce contexte qu'intervient Vuk Karadžić (1787-1864), dont la famille est origi- 
naire de l'Herzégovine orientale; il fut d'abord un petit clerc d'un important voivode de 
Karadorde, puis instituteur. Certains de ses articles furent remarqués par Jernej Kopitar, 
linguiste et philologue slovène qui a codifié le slovène. Une collaboration naît entre les 
deux hommes, Jernej Kopitar encourage Vuk Karadžić dans son travail de codification et 
de standardisation du serbe. Vuk KaradZié souhaite mettre la langue du peuple au centre 
de sa description. Dans ce but, il parcourt le terrain, recueillant a ussi bien le lexique que 
les contes ou chants populaires. Dans son premier dictionnaire, datant de 1818, suivi d'une 
courte grammaire, il intègre tous les emprunts, que ce soit ceux au turc (environ 10 % de 
son dictionnaire?), à l'allemand, au hongrois, au latin, au français, à l’italien ou au grec. 
Il y incorpore aussi le lexique du registre vulgaire, considérant que le dictionnaire doit 
réunir l'ensemble des usages. La grande innovation consiste surtout dans la codification 
orthographique : il intègre de nouvelles lettres de l’alphabet cyrillique serbe, æ, ro, 71, þ, 
et j, dont certaines étaient déjà utilisées par d'autres auteurs, mais pas de manière systé- 
matique et sans être assumées publiquement. Cette réforme fait scandale, surtout auprès 
des ecclésiastiques, qui s'insurgent contre la langue vulgaire du dictionnaire et cette 
orthographe — en particulier le j — qu’ils considèrent comme un trait trop occidental, et trop 
éloigné de la tradition de l'église orthodoxe. Malgré les critiques, voire les interdictions 
de publication par décret des écrits de Vuk Karadžić, sa réforme finit par s'imposer avec 
le temps, et cela pour plusieurs raisons à la fois concrètes et linguistiques — sans parler 
de l’évolution politique qui alla aussi dans son sens. 

Son alphabet est trés simple, instituant la régle d'une correspondance bi-univoque 
entre graphème et phonème, selon l'adage qu'on lui prête : «Piši kao Sto govoriš» soit en 
frangais « Écris comme tu parles ». Cette régle de base remporte un franc succés, puisque 
chaque variété peut ainsi trouver son expression, d'autant plus que Vuk Karadžić visait 
une unification par la langue quelles que soient les religions des locuteurs. Aux accords 
de Vienne, en 1850, les participants croates et serbes se mirent d'accord pour prendre 
le dialecte Stokavien jékavien, à savoir le même que Vuk Karadzic, comme base de 
standardisation, étant donné que celui-ci était le plus répandu et que son aire d'emploi 
se trouvait au cœur géographique de l'ensemble serbo-croate. Vuk KaradZié a publié 
également une traduction de la Bible, puis a rédigé un deuxiéme dictionnaire trés enrichi, 
ainsi qu'un certain nombre de recueils de la tradition orale. D'autres ont créé aussi des 
ceuvres littéraires en suivant ses réformes successives, ce qui a fini par asseoir sa réforme 
dans l'usage, malgré les oppositions politiques de tout ordre. Sa standardisation a été une 
réussite parce qu'elle était solide, qu'il a opéré une codification avec une description, une 
sélection et une norme prescriptive; celles-ci ont été acceptées, élaborées et renforcées 
par un cercle élargi, elles ont été enrichies successivement, offrant une base flexible à 
une nouvelle langue littéraire qui a été enseignée par la suite ". Ce mouvement était en 
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harmonie avec celui des «Illyriens » qui, du côté croate, prónait un État unique pour tous 
les Slaves du sud". 

Parallèlement à Vuk Karadžić, Ljudevit Gaj travaillait à une orthographe et à un alphabet 
latin pour les Croates. Il essayait de garder autant que possible la régle d'un rapport bi-univoque 
entre graphéme et phoneme. L’alphabet croate a finalement intégré quelques diacritiques 
(š, Z, c, €) et digraphes (/j et nj) pour créer un alphabet aussi phonétique que possible, que 
l'on appelle aujourd’hui encore la «gajica», du nom de son premier élaborateur. Ljudevit 
Gaj proposa en 1830 une premiére norme orthographique qui fut appliquée ensuite dans 
différentes revues et finit par s'imposer progressivement dans la région. 


L’alphabet cyrillique suivi des équivalents en alphabet latin 


AI|b|B|P HA PIE X| 3 H J|K HI H}|M|H BDbIOJHnH|P 
a|6 s rj|znzu|b ej|x|s|u|j k nm |m| H|Bb|o|nmn p 
AI BIVIGIDIDB EIÍZIZ|I|J|K|L Lj MIN|NIO|P|R 
albivig did ej|Z|z|i|j k,|l|l m|ni|no pir 
C T|h | Vio X | HU |) I 
cT. hyj|óboó x|u|u,|nu un 
SITICIU|F|H|C|C|DZ|S$ 
sit élu] fj|h|c éj|dz,3$ 


1.3. Les Yougoslaves 


Une premiére union des Slaves du sud vit le jour aux lendemains de la Premiére Guerre 
mondiale, avec le Royaume des Serbes, Croates et Slovènes, rebaptisé en 1929 «Royaume 
de Yougoslavie». Le serbo-croate en était la langue officielle, ainsi que le slovène, pour la 
Slovénie. En Croatie étaient publiés des ouvrages scolaires comme des ceuvres littéraires 
dans la variante croate ?. Mais cette première union ne répondait pas aux aspirations à la 
liberté et à la démocratie de ces premiers « Yougoslaves », les uns ayant hérité d'une culture 
monarchique assise sur une certaine autonomie des provinces, tandis que les autres 
souhaitaient un pouvoir centralisé, sur le modèle français. C'est avec toutes ces désillusions 
que le pays, qui n'avait qu'une vingtaine d'années, entra dans la Seconde Guerre Mondiale, 
qui connut plusieurs niveaux de conflit : ce fut, tout autant qu'une résistance contre le 
nazisme et le fascisme, une guerre civile qui vit s'imposer les partisans menés par Tito. 
La «deuxième» Yougoslavie, celle qui est née le 29 novembre 1945, sous le nom de 
« République Populaire Fédérative de Yougoslavie» (Federativna Narodna Republika 
Jugoslavija), était composée de six républiques, la Slovénie, la Croatie, la Bosnie-Herzégovine, 
le Monténégro, la Serbie — à laquelle on avait adjoint deux provinces autonomes, la Voivodine 
et le Kosovo — et la Macédoine. La capitale restait Belgrade, et Tito le chef de l'État? En 1963, 
la Constitution changea, donnant davantage d'autonomie aux différentes républiques, et 
le nom officiel devint «République Socialiste Fédérative de Yougoslavie» (Socijalisticka 
Federativna Republika Jugoslavija). L'un des problèmes était celui de la nation et de son 
rapport aux minorités qui la constituaient, avec ces structures à plusieurs étages et la volonté 
affichée d'une identité « yougoslave» et d'une adhésion à un projet politique qui auraient été 
au-dessus de toute appartenance nationale. Conformément au pragmatisme autogestionnaire, 
la politique linguistique s'est aussi efforcée de transcender ces différences tout en restant 
aussi respectueuse des droits des uns et des autres que possible — du moins pour ce qui est 
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des intentions déclarées, dans les textes constitutionnels, mais aussi, dans une large mesure, 
dans les faits, puisque beaucoup ont eu l'opportunité de suivre une scolarité dans leur langue 
minoritaire. Rappelons néanmoins que le slovène, le serbo-croate et le macédonien devaient 
étre utilisés au niveau national, tandis que chaque république — ou province — avait sa ou 
ses propre(s) langue(s) officielle(s), par exemple, au Kosovo, l'albanais, le serbo-croate et 
le turc, et, en Voivodine, le serbo-croate, le hongrois, le slovaque, le ruthéne et le roumain. 
La langue pouvait servir pour l'administration, pour l'enseignement et pour la culture. Mais 
certains chiffres parlent d'eux-m&mes, si l'on suit Kordić" : seize langues utilisées dans les 
médias (journaux, radios, télévisions), l'enseignement scolaire se faisait en quatorze langues, 
tandis qu'à l'université l'enseignement était pratiqué dans neuf langues différentes. Le 
serbo-croate était en revanche la langue unique dans I’ Armée. Bref, le probléme des langues 
minoritaires a toujours été complexe dans cette région, pourtant beaucoup considèrent que 
la politique linguistique de la Yougoslavie était exemplaire dans le monde. 

Quant au serbo-croate, il était — et il reste — polycentrique. Les livres étaient publiés 
en jékavien (où le yat, ro, se prononce [je]) à Zagreb et en ékavien (où le yat se prononce 
[e]) à Belgrade. Mais, comme le souligne Kordié P, si ces deux variétés étaient égales en 
droit, elles ne l'étaient pas forcément en prestige, d'autant plus que la capitale du pays 
se trouvait à Belgrade. L'accord de Novi Sad, qui a été décrié par la suite, a pourtant été 
signé par des linguistes et intellectuels de Croatie, de Bosnie-Herzégovine et de Serbie. 
Il était composé de dix points : 

1. une langue unique avec deux centres de diffusion principaux, Zagreb et Belgrade ; 
. les deux noms (serbe et croate) devaient se retrouver dans la dénomination; 

. les alphabets cyrillique et latin étaient admis ; 

. les prononciations ékaviennes et jékaviennes étaient admises; 

. création de dictionnaires ; 

. une terminologie commune ; 

. une orthographe élaborée conjointement ; 

. respect des variétés ; 

. des universités à Belgrade, Zagreb et Sarajevo, et deux académies, l'une à Zagreb 
et l'autre à Belgrade; 

10. l'institutionnalisation des variétés. 
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Les publications qui ont suivi cet accord se faisaient effectivement dans les deux variétés. 
Sur la base de cette déclaration, la question de la convergence et de la divergence se pose. 
Ce texte implique-t-il une unité, voire un unitarisme, ou au contraire, la pluralité et le 
pluralisme '°? Le polycentrisme sert-il finalement à unifier ou à séparer? Mais on peut 
aussi reformuler la question : le pluralisme linguistique a-t-il souffert du séparatisme et 
du nationalisme ? Cette inversion dans la problématique invite à réfléchir à contre-courant 
de la doxa actuelle dans les pays concernés. 
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2. CONVERGENCES ET DIVERGENCES AU SEIN DU BCMS D’UN POINT DE VUE 
LINGUISTIQUE 


2.1. L’éclatement 


Le serbo-croate a été l’une des langues officielles de la deuxième Yougoslavie. Il a été 
utilisé aussi en tant que langue véhiculaire, enseigné par exemple aussi en Macédoine, 
où l’on trouve encore aujourd’hui un grand nombre d’ouvrages en serbo-croate dans les 
librairies et dans les bibliothèques universitaires, qu’il s’agisse d’études publiées pendant 
la période yougoslave ou de traductions d’œuvres littéraires étrangères, existant parfois 
uniquement en serbo-croate. Pourtant, ce rayonnement réel n’a pas permis de conserver 
une unité linguistique. L’éclatement de la Yougoslavie en tant qu’Etat a eu pour consé- 
quence la création de quatre standards linguistiques, un pour chacun des pays devenus 
indépendants, à savoir le bosniaque en Bosnie-Herzégovine, le croate pour la Croatie, le 
monténégrin pour le Monténégro et le serbe en Serbie. L’ordre utilisé dans la dénomination 
« BCMS » pour éviter toute forme de hiérarchisation des différentes variétés, est l'ordre 
alphabétique, mais cela ne refléte pas l'ordre chronologique d'affirmation de chaque 
variété comme langue distincte. La méthode est simple : dans le processus de création de 
pays indépendants, chacune des anciennes républiques s'est réappropriée la langue, en 
établissant un nouveau standard et en lui donnant un nouveau nom. Néanmoins, dans ces 
cas, la tentative de lier langue et nation lors de la création d'un État n'a pas été si simple 
à réaliser, car le serbo-croate standard du xx° siècle repose sur un seul et même dialecte, 
traversé d'isoglosses phonétiques qui ne respectent pas les frontières politiques. Les 
conventions orthographiques et grammaticales du serbo-croate reposaient sur un choix 
entre deux possibilités, donc lorsqu'il s'est agi de construire des standards nouveaux, 
les grammairiens, selon les pays, ont opté pour l'une des deux possibilités offertes par la 
langue et l'écriture. Les quatre standards se recoupent donc de facto pour ces conventions 
orthographiques à choix binaires. Finalement, on arrive à cette absurdité rapportée par 
un certain nombre de témoignages (dont celui de Trudgill '’) consistant à recopier les 
anciennes grammaires du serbo-croate en en changeant les titres et quelques phrases, et 
en mettant un nouveau nom d'auteur, pour affirmer qu'il s'agit d'une langue nationale 
standard différente des autres, en Bosnie notamment. L’enjeu principal est donc bien 
de se différencier des autres variétés, de justifier les nouvelles frontières politiques par 
l'argument d'une langue nationale et de créer une nouvelle identité gráce à elle, quitte à 
plagier les anciennes grammaires tout en inventant des mythes linguistiques. 

Ce processus vaut d'une facon générale pour l'ensemble de la région, cependant, le 
pouvoir central était installé à Belgrade, qui avait par conséquent un rayonnement plus 
important que les autres capitales. Par conséquent, une asymétrie apparait, puisque ce 
processus de divergence se construit sur la base d'une opposition à la Serbie principalement : 
ce sont donc surtout les autres standards qui cherchent à se différencier du serbe. 

Le premier à chercher réellement une nouvelle identité linguistique est le croate. Il a 
été décidé dans le pays de purifier la langue des emprunts lexicaux qu'elle comportait, 
en faisant appel aux vieux vocables slaves et en construisant des néologismes sur cette 
base. Outre le remplacement des mots désignant les realia yougoslaves, typiquement taxés 
de «serbo-croates », signalons certains nouveaux mots qui sont emblématiques de cette 
période, tels zrakoplov, littéralement « aéronef», ou zrakomlat, littéralement «batteur 
d'air», qui ont été substitués à avion et à helikopter. Ces nouveaux termes étaient choisis 
à travers des publications dans les journaux gráce auxquelles la population était consultée 
et pouvait s'exprimer en votant. Le nouveau terme littéralement élu était alors adopté dans 
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la nouvelle langue. Tous les journaux pourtant ne validaient pas cette démarche, et certains 
d’entre eux ont longtemps combattu ce processus en suivant les anciennes conventions, 
jugeant les innovations ridicules, avant de devoir s’incliner devant cette purification 
linguistique, l'Académie croate et les autres institutions prescriptives nouvellement 
créées adoptant au fur et à mesure un lexique jugé de facture purement croate. Ces 
démarches n'étaient pas non plus au goût des émigrés qui n'avaient pas vécu ce parcours 
linguistique, et revenaient dans leur pays natal pour découvrir un décalage linguistique 
qu'ils trouvaient contre-nature, ce qui engendrait des désaccords, car l'application de ce 
purisme linguistique attestait (ou non) de leur loyauté nationale. 

En Bosnie-Herzégovine, en revanche, on a principalement introduit ou réintroduit en 
grand nombre des mots turcs, phénomène appelé «orientalisme». Ranko Bugarski ^ avait 
prédit dans l'un de ses articles que la «langue» monténégrine allait aussi étre créée et 
reconnue, ce qui fut officiel avec l'obtention d'un code ISO (639-2 et 3), le 8 décembre 2017. 
Deux lettres supplémentaires ont été introduites, $ et Z, dans les alphabets cyrillique et latin, 
afin de pouvoir rendre compte de toutes les variations dialectales présentes sur le territoire 
monténégrin. En Serbie, la tendance est à l'intégration de mots occidentaux, jugés prestigieux, 
surtout en matiére de technologie et de marketing, car on se veut moderne et busy. 

Malheureusement pour les grammairiens impliqués dans ces processus, malgré leurs 
efforts pour différencier les standards, le systéme linguistique reste commun. A terme, des 
écarts vont malgré tout finir par se creuser, ne serait-ce qu'à cause de ces choix lexicaux 
qui finiront par peser — et ils peuvent déjà le faire — sur l'intercompréhension dans la vie 
quotidienne. Il existe un double mouvement de convergence et de divergence entre le systéme 
linguistique et le systéme social. Quatre standards existent pour une seule langue, et on a 
quatre dynamiques d'évolution linguistique, qui, au final, reposent sur le méme principe 
d'individuation. Ces replis identitaires qui dominent dans les discours ne rendent pourtant pas 
compte de toutes les observations que l'on peut faire au quotidien. En effet, les individus sont, 
pour leur part, trés mobiles. Outre ces couples «mixtes» toujours cités en exemple, nombre 
de familles vivent des deux cótés de la frontiére, les aléas économiques font que les jeunes 
migrent, mais surtout, nombre de rencontres culturelles ou sportives font que les échanges 
sont fréquents, qu'il s'agisse de folklore, de festival de littérature, de cinéma ou de musique, 
ou encore de concours sportifs qui dépassent, y compris au niveau scolaire, les différentes 
frontières. Les jeunes prennent leurs voitures et passent trés souvent leurs week-ends ou 
leurs vacances dans un autre pays issu de la Yougoslavie. Un gouffre générationnel s'est 
installé. Est-ce le fait d'un tabou présent dans les différents enseignements, ou d'une histoire 
pour laquelle le recul manque ? Ou de postulats idéologiques ? Chacune de ces explications 
comporte certainement sa part de vérité, mais la surprise est grande de voir que ceux qui 
sont nés à l'époque de Tito, et qui ont aujourd’hui une quarantaine d'années, deviennent 
des fossiles de l’histoire et doivent expliquer «comment c'était avant» lorsque la curiosité 
d'un jeune s'exprime, et de voir certaines pratiques inimaginables auparavant s’ instaurer. 
Si les anciennes générations étaient nourries de films montrant des partisans combattant les 
nazis et lisaient dans leurs programmes des poésies telles que «Jama», «le Gouffre», d'Ivan 
Goran Kovačić, aujourd’hui, même Ivo Andrić, le seul prix Nobel yougoslave, est souvent 
absent des programmes scolaires, car considéré comme «étranger». Le titre de son roman 
le plus connu, Na Drini ćuprija (Le Pont sur la Drina), contient le mot ćuprija «pont» 
(turc köprü), au lieu de la forme standard most. Dans le texte pourtant, c’est most qui est 
employé. Les élèves de Serbie doivent choisir aujourd" hui dans leur cursus entre deux options : 
soit l'enseignement religieux, soit l'éducation civique. C'est dans ce contexte qu'est né un 
mouvement, appelé la « Yougonostalgie », ot l'on exploite, pour des raisons touristiques et 
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économiques notamment, l'effigie de Tito. Mais ce mouvement exprime aussi le besoin de 
revenir sur le passé pour mieux comprendre le présent et le futur : la place des pays issus 
de l'ancienne Yougoslavie les uns par rapport aux autres, dans l’Europe, et dans le monde. 


2.2. Systéme de la langue et variations entre les standards 


Paul-Louis Thomas a déjà, à de nombreuses reprises '’, décrit et analysé la façon dont se 
construisent les standards issus de la Yougoslavie. Le lecteur pourra se référer à ses articles, 
dans la lignée desquels je m'inscris et dont je me sers ici”. Le BCMS est un seul et même 
systéme linguistique — les problémes sociolinguistiques mis à part. Les quatre standards 
actuels reposent sur le méme dialecte, le Stokavien, qui avait été choisi par les Croates et les 
Serbes pour servir de base aux premières standardisations du xix? siècle. De fait, ces premières 
standardisations étaient convergentes. Au xx* siècle, il existait un standard commun, avec une 
reconnaissance de variétés régionales qui permettaient d'ancrer géographiquement la langue. 
Les standards actuels correspondent toujours à la méme description. La traduction est de fait 
inutile, l'intercompréhension existant normalement entre les locuteurs des quatre capitales. 
Rappelons par ailleurs que, pour créer un nouvel embranchement dans une représentation 
arborescente des familles linguistiques, il faut des innovations linguistiques qui different 
du systéme originel, comme celles, par exemple, qui ont donné naissance aux différentes 
langues romanes. Or, les quelques innovations que l'on peut observer dans l'ensemble 
BCMS sont toutes partagées comme, par exemple, l'évolution morpho-phonétique du 
génitif pluriel des féminins se terminant par deux consonnes (karta «carte» : G. pl. karata 
7 karti), ces deux formes du génitif étant actuellement en concurrence dans les standards. 
Quelques précisions supplémentaires sont toutefois nécessaires. 

Si l’on considère que le polycentrisme était déjà acquis du temps de la Yougoslavie?!, 
puisque les variations régionales étaient déjà répertoriées sous Tito, on ne peut que 
constater le maintien d'un systéme qui, dans son ensemble, est identique ou quasiment. 
Que ce soit du point de vue de la morphologie, de la syntaxe ou de la sémantique, l'unité 
est frappante : le systéme est le méme. Quelques exemples vont néanmoins illustrer les 
types de variations qui se présentent, afin de donner une idée plus précise des différences 
sur lesquelles s'appuient les revendications identitaires. 

Concernant l'orthographe d'abord, il faut revenir pour le préciser sur le principe de base 
qui est d'«écrire ce que l'on entend, et de prononcer ce qui est écrit», selon la formule 
de Vuk Karadzi¢, qui a instauré une écriture phonétique. Malgré cela, des variations 
orthographiques existent entre les différents standards. En croate et en monténégrin, il 
faut écrire podcenjiti, « déprécier», avec un d devant les affriquées, tandis qu'en serbe et 
en bosniaque, il faut l'écrire avec un f, donc potcenjiti, la prononciation restant identique 
puisque l'assimilation régressive est évidemment la régle dans tous les standards. Le futur 
aussi s’écrit différemment en croate et en bosniaque, čitat cu, au lieu de citacu en serbe et en 
monténégrin, pour «je lirai» (qui se construit avec la base du verbe et l’auxiliaire «vouloir», 
qui donne la désinence), bien que la prononciation soit la méme partout. Néanmoins, la 
première variante (čitat cu) étant celle qui prévalait anciennement, les générations plus 
âgées en Serbie utilisent encore l'orthographe qui est aujourd'hui celle du croate. Une 
autre différence orthographique de taille est celle qui concerne les emprunts lorsqu'ils 
sont écrits en alphabet latin : tandis que les Croates garderont la transcription exacte du 
nom étranger, les Serbes opéreront la transphonologisation pour l'écrit aussi. Nous aurons 
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donc New York en croate, et Nju Jork en alphabet latin ou Hy Jopx en alphabet cyrillique 
pour le serbe. Il est courant de trouver dans les revues serbes l'orthographe originelle, en 
particulier lorsqu'il s'agit de marques (de baskets ou d'outils informatiques par exemple). 
La prononciation reste partout la méme en revanche. Dans les standards qui possédent un 
alphabet autre, cyrillique ou arabe par exemple, les noms propres sont reproduits au plus prés 
de la prononciation initiale : Dostojevski, Cehov, Puskin. Pour ce qui est de la phonétique, 
1l faut noter les distinctions qui correspondent à un découpage des isoglosses qui créent des 
ensembles dialectaux entre ékavien, jékavien et ikavien qui concernent la prononciation du 
e dans des mots tels que : mleko, mlijeko, mliko pour «lait». Ces variations phonétiques 
ne correspondent ni aux découpages des dialectes kajkavien, éakavien et Stokavien qui 
peuvent avoir les trois prononciations, ni aux frontières politiques, car ces isoglosses les 
traversent toutes : ces isoglosses ne sont par conséquent pas un argument de différenciation 
des standards ”, officiellement, les standards croate, bosniaque, monténégrin et serbe de 
Bosnie sont jékaviens, tandis que le serbe de Serbie est ékavien. 
On peut citer un unique exemple de variation morphosyntaxique avéré qui servirait 

à distinguer le bosniaque : cela concerne la forme de l'accusatif du pronom personnel 
féminin, qui reste toujours ju en bosniaque, tandis qu'en croate, en monténégrin et en 
serbe, on a une distribution complémentaire entre je et ju qui le remplace si ce pronom 
précède l’auxiliaire «être» à la troisième personne du singulier du présent, dont la forme 
est identique, comme le montre l'exemple suivant : 

(1) On ju je video. (« *On je je video.) 

«Il l'a vue.» (bosniaque, croate, monténégrin et serbe) 

(2a) On ju vidi. 

«Il la voit.» (bosniaque) 

(2b) On je vidi. 

«Il la voit.» (croate, monténégrin et serbe) 


L'exemple de syntaxe habituellement mis en exergue comme constituant une 
différence fondamentale entre le serbe et le croate, à savoir l'usage de subordonnées 
infinitives à la place de subordonnées complétives n'est qu'une différence de fréquence, 
puisque l'une comme l'autre construction peut étre employée dans les deux standards. 
Sila subordonnée complétive (3b) est certes plus fréquente au sud-est de la Serbie, sous 
l'influence du Sprachbund balkanique ?, l'infinitive (3a) est trés courante à Belgrade, 
ou dans les couches socioéconomiques supérieures partout en Serbie, et les deux types 
de subordonnées sont aussi utilisés en Croatie, où l'infinitive prédomine toutefois, en 
particulier avec les verbes modaux. 

(3a) Ona voli citati. 
« Elle aime lire.» 
(3b) Ona voli da cita. 
«Elle aime lire». 


Quant au lexique, on peut citer beaucoup d'exemples : du temps de la Yougoslavie déjà, 
on trouvait de façon assez systématique un précis lexical en fin d'ouvrages littéraires?" 


22. Une députée d'une région serbe a utilisé récemment l'ékavien au parlement croate, ce qui a créé un 
tollé général, car elle aurait parlé «serbe» au parlement croate : or, les Croates issus de la méme 
région utilisent eux-mêmes aussi l'ékavien. 

23. La disparition de l'infinitif dans les langues balkaniques est un trait de convergence majeur de 
l'union linguistique balkanique. 
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pour les mots plus rares, des termes littéraires, ou bien des termes dialectaux ou étrangers 
par exemple. Ces derniéres décennies, c'est surtout au niveau lexical que les standards 
se trouvent différenciés. La purification de la langue croate a été fortement mise en place 
dans les années 1990. Cette démarche a donné naissance à toute une série de plaisanteries 
proposant des néologismes cocasses — sur le principe de l'allemand où l'on peut créer 
de nouveaux mots par composition, type de formation qui est aussi vivant en BCMS. 
Ainsi, un «mouton» sera «un herbe-mangeur laineux à quatre pattes» : Cetvoronozno 
vuneno travocupkalo tandis que la vache sera un « herbe-mangeur cornu» : rogato 
travojedalo. Blague à part, 1l existe évidemment un lexique dialectal propre au serbe et 
au croate différencié de longue date : serbe hleb / croate kruh, «pain», serbe sprat / croate 
kat, «étage », serbe voz / croate vlak, «train», etc. Certains lexémes se différencient par 
leurs suffixes en serbe et en croate, sachant toutefois que les deux suffixations existent 
dans toutes les variétés : serbe interesirati / croate interesovati, «intéresser» (transposé 
en français, le «boulanger » serait le «boulangeur » ailleurs). Quant au bosniaque, on 
y a (ré)introduit toute une série d'«orientalismes », à savoir des mots d'origine turque, 
arabe ou perse passés en bosniaque. Ivo Andrié est l'un des écrivains qui ont beaucoup 
utilisé ce genre de vocabulaire, notamment dans son chef-d’ceuvre, Le Pont sur la Drina. 

Voilà, en résumé, les principales différences que l'on trouvera entre les quatre standards, 
qui sont non seulement fondés sur le méme dialecte slave du sud, mais qui sont aussi régis 
par les mémes principes linguistiques. On pourrait détailler davantage la description de 
ces variations, mais il n'en reste pas moins évident que quelques paragraphes suffisent à 
caractériser ces différences linguistiques qui sont exploitées surtout à des fins politiques. 


2.3. De la dialectologie à la typologie et au contact de langues 


L'ensemble BCMS comprenait à l'origine trois dialectes principaux, le Stokavien, le 
kajkavien et le Cakavien, dont les noms reposent sur la forme du pronom relatif-interrogatif 
«que / quoi», respectivement Sto, kaj et ca. Le kajkavien peut étre considéré comme un 
dialecte à mi-chemin entre le slovène et le croate, l'aire kajkavienne se situant effectivement 
au nord-ouest de l'ensemble serbo-croate. Cette aire englobait initialement la capitale 
de la Croatie, Zagreb, mais au xix? siècle, le rapprochement avec l'ensemble slave du 
sud, le prestige de la littérature de Dubrovnik et le fait que le Stokavien était parlé dans 
l'aire géographique la plus importante ont pesé en faveur du choix du Stokavien par les 
Croates pour la standardisation : « Cela peut paraitre paradoxal aujourd'hui, mais l'idée 
“yougoslave” est partie de Croatie”. » L'aire éakavienne enfin se situe au sud-ouest de la 
Croatie. Entre les locuteurs de ces trois dialectes parlés en Croatie, l’intercompréhension 
est plus difficile qu'entre habitants des quatre capitales. 

Si l'on observe les découpages dialectaux en Serbie, il existe une vraie coupure entre 
le sud et le nord de la Serbie : en s'éloignant de Belgrade et du centre pour se rapprocher 
de la Macédoine et de la Bulgarie, on s'éloigne graduellement du standard pour arriver à 
un ensemble dialectal qui présente une réduction casuelle. Il s'agit du torlak, parlé au sud- 
est de la Serbie, qui s'inscrit dans la zone de transition entre le BCMS et le macédonien 
et le bulgare. Le bulgare et le macédonien ont perdu les cas du slave commun et, dans 
les parlers torlaks nord-ouest, l’instrumental et le génitif ont fusionné, tandis qu'ailleurs, 
le locatif et le génitif fusionnent avec le nominatif, comme dans l'exemple suivant oü la 
préposition u («dans») est suivie du nominatif nase selo («notre village»), au lieu du 
locatif qui serait demandé dans le standard. De méme, le standard demanderait le génitif 
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aprés le verbe «avoir» à la troisiéme personne du singulier du présent pour «il y a», 
tandis qu'ici, il est remplacé par le nominatif. 


(4) U nase selo ima svakakvi ljudi. 
«Dans notre village, il y a des gens de toutes sortes.» 


Par conséquent, le marquage casuel, synthétique dans le standard, devient analytique 
dans ce dialecte de transition. Il s'agit d'un changement essentiel dans le systéme 
linguistique du BCMS : ce changement linguistique est de nature typologique puisque 
le systéme casuel est réduit, certains cas disparaissent des paradigmes, ce qui implique 
une réorganisation morphosyntaxique très importante du système. Les différences sont 
ainsi plus grandes à l'intérieur des pays, qu'il s'agisse de la Croatie (avec le kajkavien 
et le Cakavien qui se trouvent à l'ouest du pays), ou de la Serbie (avec le torlak qui se 
trouve au sud), qu'entre les capitales respectives, Zagreb et Belgrade. 

La présence d'isoglosses au sein de ces dialectes complique cependant cette première 
présentation. Il s'agit de l'évolution du yat rendu selon les régions par i bref ou long, 
€ bref ou long, ou encore je bref ou ije long”®, ce qui peut être exemplifié par les termes 
suivants : divojka, devojka, djevojka / devojka, pour «jeune femme», mliko, mleko, 
mlijeko, pour «lait», lip, lep, lijep, pour «beau». Ces isoglosses traversent les dialectes 
précédemment cités, ainsi le Cakavien est surtout ikavien, mais il peut aussi être ékavien, 
et méme jékavien, tandis que le kajkavien est surtout ékavien, mais on y trouvera aussi 
des parlers ikaviens, voire jékaviens. 

Du point de vue des standards en revanche, le jékavien est la norme en Croatie, en 
Bosnie-Herzégovine et au Monténégro, alors que l'ékavien est largement majoritaire 
en Serbie, où il prédomine, sauf dans une zone, non négligeable, qui longe la frontière 
bosniaque. Il serait donc faux de dire que le serbe est ékavien par opposition aux autres 
variétés, méme si l'ékavien représente un grand ensemble homogéne, numériquement le 
plus important en Serbie, et qu'il englobe Belgrade, ville dont le rayonnement s'étend sur 
toute la région balkanique. Rien en réalité n'est plus irrespectueux des frontiéres politiques 
dans l'espace yougoslave que les dialectes et les différentes isoglosses. Les unions et les 
désunions ne suivent pas la douane, bien au contraire. Je fais référence à Kortmann et 
Bisang?' en mentionnant à la fois la dialectologie, la typologie et le contact de langues 
dans le titre de cette section, car tout simplement, les influences linguistiques sont trés 
nombreuses sur cet ensemble linguistique : celle du Sprachbund balkanique pour le sud- 
est de la Serbie (par exemple dans le cas des subordonnées infinitives ou complétives), 
l'influence italienne sur la cóte dalmate, ou encore celle de l'allemand, du frangais, du 
russe, du turc, du hongrois, du romani, et de bien d'autres langues. 


3. LA DECLARATION DE LA LANGUE COMMUNE 


3.1. La déclaration et son contexte 


Dans ce contexte global est née une initiative d'un groupe d'intellectuels, d'artistes, de 
chercheurs (dont des linguistes de renommée) : la Déclaration de la langue commune, 
élaborée au printemps 2017. Celle-ci a été largement médiatisée, et elle a recueilli, à 
l'heure actuelle, plus de 9 000 signatures en ligne : le nombre de signataires n'est certes 
pas trés important, mais la démarche mérite l'attention. La déclaration commence par la 
phrase : « À la question de savoir si en Bosnie-Herzégovine, au Monténégro, en Croatie et 
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en Serbie on utilise une langue commune, la réponse est affirmative.» On y explique qu’il 
s’agit d’une langue polycentrique, et qu’il faut arréter toute discrimination, ségrégation 
ou répression linguistique — qu'elle soit régionale ou étatique. On y revendique un certain 
nombre de droits, dont celui de dénommer sa langue, ou sa variété, selon la volonté du 
locuteur, en sachant que cela ne remet pas en cause le droit de chacun à l'expression 
d'une appartenance ethnique, religieuse ou nationale. La diversité linguistique y est vue 
comme une richesse, sans minorer ou majorer les variétés, et on y revendique le droit, 
pour les individus comme pour les artistes, d'utiliser des variétés dialectales ou régionales 
diverses, voire de mélanger les différentes variétés. Cela va à l'encontre, comme on peut 
l'imaginer, de l'idée, ou plutót de l'idéologie de la «pureté de la langue». 

Le poids de la «norme» est effectivement trés important dans les territoires de l'ex- 
Yougoslavie. Il faut toujours s'y conformer à la «norme», qu'elle soit objective — dans 
le cadre d'une grammaire normative — ou imaginée, projetée. Au niveau linguistique, 
cela suppose, si on veut accéder à un emploi plus prestigieux et mieux rémunéré, une 
adéquation à la tonalité du standard et une conformité grammaticale sans faille. Des contre- 
exemples peuvent cependant étre cités, tel ce ministre de l'intérieur dont la grammaire 
laissait à désirer, et qui de ce fait était discrédité, et faisait l'objet de railleries fréquentes : 
la glottophobie” était utilisée pour le dénigrer en tant qu’acteur politique. Tout enseignant 
doit avoir une parfaite connaissance de la norme grammaticale et gommer tout accent 
dialectal. Pourtant, une oreille avertie peut reconnaitre à son accent l'origine géographique 
de son interlocuteur. La discrimination selon le sociolecte et selon le dialecte est un fait 
dans toutes les régions de l'espace yougoslave. Le prestige du standard devient à ce point 
un moyen de pression, pour ne pas dire de répression sociale, que cela installe une forte 
insécurité linguistique, puisque la variation s'applique selon tous les axes que l’on connaît, 
que ce soit la variation diatopique ou diastratique, sans parler des minorités linguistiques. 

Finalement, on se retrouve avec un paradoxe : d'un point de vue linguistique, on a un seul 
système, tandis que d'un point de vue sociolinguistique, on se retrouve avec une multitude 
de noms de la langue (lingonymes ?) puisqu'aucun de ces noms ne fait l'unanimité, ni ne 
peut faire l'unanimité, et encore moins celui du BCMS. Un hyperonyme faisant défaut, 
cet acronyme a le mérite d'étre, me semble-t-il, le plus «politiquement correct». Mais 
pourquoi un nom de langue serait-il plus ou moins «politiquement correct» ? Pourquoi, 
en particulier lorsque l'on franchit les frontiéres de ces pays, la langue est-elle un enjeu 
politique ? Peut-on alors tracer des frontières scientifiques ? 


3.2. Les réactions et les débats 


Dans quelle mesure la langue est-elle le support d'une définition identitaire ? Elle est utilisée 
pour se définir, s'autoproclamer d'une nation ou d'une autre, surtout sur ces territoires 
anciennement yougoslaves. Si la langue sert d'argument pour la construction d'une nation, 
alors elle devient de facto un objet politique, et par conséquent un objet dont les respon- 
sables politiques se servent. On ne peut cependant repousser une évidence : vu que tout le 
monde se sert de la langue, tout le monde a son opinion sur la langue. Mais la science sur 
la langue existe, à savoir la linguistique : cependant, les linguistes ont eux-mémes leurs 
positionnements et ancrages sociaux et, logiquement, leurs propres expériences et visions 
de la langue. Certains d'entre eux ont participé à la Déclaration de la langue commune, 
qui est un exemple de production dont chaque virgule a été pesée, pour obtenir un texte 


28. Blanchet (2016). 
29. Calic (2018) et Thomas (2002 : 318). 
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auquel, d'un point de vue sociolinguistique, on ne peut concrétement rien redire. Cette 
déclaration est factuelle, elle est évidente, d'un point de vue scientifique, elle est limpide. 

Pourtant, des critiques de toutes sortes lui ont été faites, dans les médias, sur internet, lors 
des conférences organisées. L'un de ces débats a eu lieu entre Snjezana Kordié, linguiste, 
l'une des initiatrices de cette déclaration, et Boris Buden, journaliste et écrivain, sur un 
site d'un «réseau d'émancipation» soutenu par plusieurs associations et mouvements 
collectifs de Croatie, et soutenu financiérement par l' Agence des médias électroniques, le 
Centre audiovisuel de Croatie et la ville de Zagreb, et qui s'appelle Slobodni Filozofski, en 
traduction « Libres philosophiquement ». Leurs articles sont parus entre décembre 2017 et 
fin aoüt 2018. Boris Buden a signé la déclaration, mais en formulant beaucoup de critiques. 
Il dit entre autres que la déclaration ne fait pas état du contexte, de l'ancrage historique et 
social, et qu'elle se veut apolitique : or, pour lui, il s'agit d'un texte fonciérement politique, 
et il faut l'assumer. Dans son dernier texte, il aborde la question du nationalisme, en 
disant qu'il y a un «bon» nationalisme et un «mauvais» nationalisme. Veut-il distinguer 
quelque chose comme le «patriotisme » face au «nationalisme» ? Comment congoit-il 
dans ce cas l'identité ? et, par ailleurs, le pluralisme? Pour SnjeZana Kordic, Boris Buden 
se complait dans la déconstruction car ses critiques ne sont pas fondées. Elle a rédigé 
un livre, Jezik i nacionalizam (Langue et nationalisme), où elle traite en détail tous ces 
sujets, et qui a servi à poser les bases du projet ayant donné naissance à la Déclaration 
de la langue commune. Le texte de la déclaration est épuré, mais, étant donné le contexte 
global, il n'est de fait ni naif, ni neutre politiquement, il implique en soi une prise de 
position, et certaines personnalités connues ont dü méme retirer leurs signatures de 
la pétition sous la pression de la communauté environnante. D'autres noms peuvent 
manquer : les personnes en poste sont-elles libres ou non de signer, risquent-elles leurs 
postes en apposant leur nom en bas du texte? En revanche, des linguistes de renommée 
mondiale ont pris position en faveur de ce texte, tels Trudgill ou Chomsky; ce dernier a 
publié un recueil d'articles rédigés à travers les dernières décennies qui a été publié en 
serbo-croate (traduit de l'anglais) en 2018, Jugoslavija : mir, rat i raspad (Yougoslavie : 
paix, guerre et éclatement). 

Cette déclaration est effectivement ressentie comme un danger par les nationalistes 
de tous ces pays. Chacun veut faire de cette langue la sienne, or la langue appartient à 
tout locuteur. Cependant, dire que la langue est commune à quatre pays semble entraver 
la construction identitaire et nationale qui est encore récente, et qui utilise l'individuation 
de la langue comme moyen. De ce fait, chacun des camps extrémes a accusé le camp 
opposé d'avoir rédigé cette déclaration pour subordonner la langue des voisins, et donc 
les voisins. La déclaration met toutes les variétés sur un pied d'égalité, or un nationaliste, 
par définition, postule une hiérarchie dans laquelle sa variété est la plus importante, et 
surtout, il en crée une s'il en a besoin pour asseoir sa nation, son pouvoir et son hégémonie 
économique. Comme cette déclaration met en rapport la variété linguistique entre les 
quatre pays avec la variation linguistique interne à chacun des pays, pour demander une 
simple reconnaissance de la diversité et de la pluralité, et donc une égalité de traitement 
des variétés et des porteurs de la langue, elle contrevient effectivement aux postulats des 
nationalistes qui rêvent d'une langue pure en oubliant que leurs voisins directs possèdent 
un autre idiolecte. Le jeu de construction nationaliste basé sur la langue a donc pour 
conséquences deux effets nocifs dans ce cas : celui de vouloir se distinguer de son voisin 
à tout prix, et celui de nier, voire d'effacer sa propre richesse dialectale en instaurant une 
autorité absolue de la norme et du standard. 


30. Voir Amselle (1990) ou Canut (2007) pour la déconstruction de ce concept. 
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Snjezana Kordié n'a pas obtenu un poste en Allemagne parce qu'elle avait refusé de 
réduire le nom de la langue au seul «croate». Quelles sont les langues qui détiennent 
des chaires ? Jelena Calié a soutenu une thèse à l’University College London sur la 
question de l'institutionnalisation du nom des chaires dans l'espace yougoslave aussi 
bien qu'ailleurs. En France, certaines universités ont désormais soit du croate, soit du 
serbe, soit du serbo-croate (Université de Poitiers), soit encore du BCS (bosniaque-croate- 
serbe, à l'INALCO), ou du BCMS (à la Sorbonne). Comment faire lorsqu'une langue, à 
savoir le serbo-croate, sert de base pour les normes de quatre standards qui sont issus de 
la méme matrice? Une langue sert ici pour quatre identités, on opposera alors le systéme 
langue qui est commun, au systéme sociolinguistique, qui constate la séparation et en 
fait état. Concrétement, dans un parcours individuel, les étudiants s'inscrivent souvent 
indifféremment dans les cursus existants : ainsi, des étudiants d'origine monténégrine 
suivent les cours de bosniaque-croate-serbe à l'INALCO. 


3.3. La glottophobie 


Il va de soi que cette situation globale instaure avant tout une atmosphere propice a 
l'insécurité linguistique, fait que je pourrais étayer par de nombreux exemples. Ainsi, les 
enfants et petits-enfants se permettent de corriger leurs parents et leurs grands-parents dés 
qu'ils font des études supérieures ou ils finissent d'acquérir ce qui leur semble une langue 
pure et belle. Les corrections et jugements entre locuteurs localement, ou en dehors de 
leurs pays respectifs, sont foisonnants. On se permet de juger l'autre à sa fagon de parler, 
pour le discréditer. Les émigrés en sont les cibles favorites, car leur présupposée réussite 
financiére doit étre compensée localement par le prestige linguistique qu'ils ne peuvent 
avoir; de toute manière, ils ne sont pas censés lire puisqu'ils représentent souvent une 
classe stéréotypée de nouveaux riches sans culture générale. Le retour de ces émigrés, 
ou des enfants de la diaspora, est donc souvent vécu de fagon douloureuse, car ils sont 
l'objet privilégié de cette glottophobie. Une députée serbe de Croatie a eu le malheur 
de parler fin 2017 en ékavien au parlement, ce qui a provoqué un tollé général, car le 
standard est jékavien. Or, les frontiéres en matiére de langues sont poreuses. L'un de ses 
collégues, croate, est venu à sa rescousse en disant que lui aussi, tout en étant croate, 
parlait en ékavien, comme tout le monde dans la région d'oü ils viennent. 

Philippe Blanchet a trés bien décrit tous ces phénoménes dans son ouvrage sur la 
glottophobie?'. La minoration de certaines variétés implique la majoration de celle à 
laquelle on donne du prestige, et effectivement, c'est là «le contraire de l'égalité ?». 
Le purisme est en soi l'expression de la glottomanie, d'un réve projeté, la représentation 
d'un imaginaire. Mais comme le rappelle Blanchet”, l'hégémonie est une expression 
de la domination. Ainsi en est-il par exemple du cyrillique en Serbie. La Constitution a 
récemment été changée pour ne plus conserver que le cyrillique en Serbie, ce qui est une 
aberration, puisque, justement, dans les faits, et surtout chez les jeunes sous l'influence 
des nouvelles technologies, c'est bien l'alphabet latin qui prédomine. On crée donc 
une nouvelle fois un écart entre la pratique et la loi, ou la majorité des locuteurs et une 
classe qui se considére comme l'élite. Le parlement de la Voivodine a en revanche gardé 
l'ancienne loi qui admet le cyrillique et le latin dans l'usage. 

L'un des paradoxes frappants de toute cette aire géographique yougoslave est de voir 
le nombre de recherches sur les dialectes et le nombre de descriptions : est-ce dans un but 


31. Blanchet (2016). 
32. Id. (2016 : 18). 
33. Id. (2016 : 20). 
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purement scientifique ? Patrimonial? Ou est-ce pour mieux reléguer ces parlers dans un 
placard, tout en les ayant décrits, peut-étre par acquit de conscience? À qui servent-elles 
si les locuteurs en question sont mis au ban de la société parce qu'ils ne maitrisent pas 
le standard majoritaire et si on leur refuse de mélanger les différents dialectes, ce qui 
pourtant, sur le terrain, est une donnée de base dans la vie quotidienne? 


4. CONCLUSION 


Des journalistes qui relataient la rencontre entre les chefs des États croate et serbe ont 
osé poser la question suivante comme titre pour l'article qui accompagnait la photo de la 
poignée de mains sur un pont : « Dans quelles langues parlent nos présidents quand ils se 
rencontrent? » La question se pose effectivement. Quel est le rapport entre l'unicité et le 
pluralisme? Que ce soit à l’intérieur des pays, ou en dehors de leurs frontières politiques, 
doit-on parler de contacts entre différentes variétés? Est-ce que ce sont réellement des 
«langues» ou plutót des standards en contact ou en conflit? Le purisme n'est-il pas un 
appauvrissement de cet ensemble linguistique? N'étouffe-t-il pas la ou les langues en 
réalité? Quelle place reste-t-il pour le pluralisme avec un héritage culturel (pour ne pas 
citer Bourdieu) issu d'une guerre ? *4 


ANNEXE : DÉCLARATION DE LA LANGUE COMMUNE (EN FRANCAIS ET EN BCMS) 


Face aux conséquences négatives tant au plan social, culturel qu'économique des manipulations 
politiques et des politiques linguistiques actuelles en Bosnie-Herzégovine, au Monténégro, en 
Croatie et en Serbie, nous, soussignés, portons la 


DÉCLARATION DE LA LANGUE COMMUNE 


À la question de savoir si une langue commune est utilisée en Bosnie-Herzégovine, Croatie, 
Monténégro et Serbie, la réponse est affirmative. 

Il est question d'une langue standard commune de type polycentrique — à savoir d'une langue 
parlée par plusieurs peuples dans plusieurs pays avec des variantes reconnaissables — comme le 
sont l'allemand, l'anglais, l'arabe, le frangais, l'espagnol, le portugais et beaucoup d'autres. 
Cela est corroboré par le fait que le &tokavien sert de base commune à la langue standard, la 
proportion de l' identique par rapport à ce qui est divergent dans la langue et l'intercompréhension 
subséquente. 

Le fait d'utiliser quatre dénominations pour les variantes standard — le bosniaque, le monténégrin, 
le croate et le serbe — ne signifie pas que ce sont quatre langues différentes. 

Insister sur le petit nombre de différences existantes et la différenciation forcée des quatre 
variantes de standard conduit à une série de phénomènes négatifs d'ordre social, culturel et 
politique à l'instar de l’utilisation de la langue comme argument pour la ségrégation des enfants 
dans certains milieux multiethniques, des «traductions» inutiles dans les services administratifs 
ou dans les médias, de l'invention de différences là où elles n'existent pas, de contraintes 
bureaucratiques, de méme que de censure (et a fortiori l'autocensure), à travers lesquels 
l'expression linguistique s'impose comme le critére d'appartenance ethnique et nationale et le 
moyen de prouver sa loyauté politique. 


Nous, les signataires de cette Déclaration, considérons que 


* le fait qu'il existe une langue commune polycentrique ne remet pas en question le droit indi- 
viduel à exprimer son appartenance à différents peuples, régions ou pays; 

* tout pays, nation, groupe ethnique ou communauté régionale peut librement et de facon auto- 
nome codifier sa variante de la langue commune; 


34. J'aimerais remercier mes relecteurs, Claire Le Feuvre, Alain Christol, Bernard Lory et Frédérique 
Fleck, pour leur relecture aussi attentive qu'attentionnée. 
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* les quatre variantes standard existantes actuellement sont égales en droit et on ne peut consi- 
dérer que l’une d'entre elles serait la langue, tandis que les autres ne seraient que des variantes 
de cette langue. 


De ce fait, nous, les signataires de cette Déclaration, appelons à 


* l'arrét de toute forme de ségrégation linguistique et de discrimination linguistique dans les 
institutions éducatives et officielles ; 

* la cessation des pratiques de différentiation linguistique qui sont répressives, inutiles et nuisibles 
pour les locuteurs ; 

* l'arrét d'une définition rigide des variantes standard ; 

* la cessation des «traductions» inutiles, insensées et chéres dans les pratiques juridique et 
administrative ; 

* la liberté du choix individuel et la prise en considération de la variété linguistique ; 

* la liberté linguistique dans la littérature, l'art et les médias; 

* la liberté de l'usage dialectal et régional ; 

* et, finalement, la liberté de «mélanger», l'opportunité d'emprunter, mais aussi d'introduire les 
formes et les expressions différentes de la langue commune au service général de tous ses locuteurs. 
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Suočeni s negativnim društvenim, kulturnim i ekonomskim posljedicama političkih manipu- 
lacija jezikom i aktualnih jezičnih politika u Bosni i Hercegovini, Crnoj Gori, Hrvatskoj i 
Srbiji, mi, doljepotpisani, donosimo 


DEKLARACIJU O ZAJEDNIČKOM JEZIKU 


Na pitanje da li se u Bosni i Hercegovini, Crnoj Gori, Hrvatskoj i Srbiji upotrebljava zajednički 
jezik — odgovor je potvrdan. 

Riječ je o zajedničkom standardnom jeziku policentričnog tipa — odnosno o jeziku kojim 
govori više naroda u više država s prepoznatljivim varijantama — kakvi su njemački, engleski, 
arapski, francuski, španjolski, portugalski i mnogi drugi. Tu činjenicu potvrđuju štokavica kao 
zajednička dijalekatska osnovica standardnog jezika, omjer istoga spram različitoga u jeziku i 
posljedična međusobna razumljivost. 

Korištenje četiri naziva za standardne varijante — bosanski, crnogorski, hrvatski i srpski — ne 
znači da su to i četiri različita jezika. 

Inzistiranje na malom broju postojećih razlika te nasilnom razdvajanju četiri standardne varijante 
dovodi do niza negativnih društvenih, kulturnih i političkih pojava, poput korištenja jezika kao 
argumenta za segregaciju djece u nekim višenacionalnim sredinama, nepotrebnih” prevođenja” u 
administrativnoj upotrebi ili medijima, izmišljanja razlika gdje one ne postoje, birokratskih prisila, 
kao i cenzure (te nužno auto-cenzure), u kojima se jezično izražavanje nameće kao kriterij etno- 
nacionalne pripadnosti i sredstvo dokazivanja političke lojalnosti. 


Mi, potpisnici ove Deklaracije, smatramo da 


* činjenica postojanja zajedničkog policentričnog jezika ne dovodi u pitanje individualno 
pravo na iskazivanje pripadnosti različitim narodima, regijama ili državama; 

e svaka država, nacija, etno-nacionalna ili regionalna zajednica može slobodno i samostalno 
kodificirati svoju varijantu zajedničkog jezika ; 

* sve Četiri trenutno postojeće standardne varijante ravnopravne su i ne moze se jedna od njih 
smatrati jezikom, a druge varijantama tog jezika. 


Stoga, mi, potpisnici ove Deklaracije, pozivamo na 


* ukidanje svih oblika jezične segregacije i jezične diskriminacije u obrazovnim i javnim 
ustanovama ; 

* zaustavljanje represivnih, nepotrebnih i po govornike štetnih praksi razdvajanja jezika ; 

* prestanak rigidnog definiranja standardnih varijanti ; 

* izbjegavanje nepotrebnih, besmislenih i skupih” prevođenja” u sudskoj i administrativnoj 
praksi kao i sredstvima javnog informiranja ; 

* slobodu individualnog izbora i uvažavanje jezičnih raznovrsnosti ; 

e jezičnu slobodu u književnosti, umjetnosti i medijima ; 

* slobodu dijalekatske i regionalne upotrebe ; 

* i, konačno, slobodu” miješanja”, uzajamnu otvorenost te prožimanje različitih oblika i 
izričaja zajedničkog jezika na sveopću korist svih njegovih govornika. 
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CRITIQUE LITTERAIRE GRECQUE ET POESIE LATINE : 
DENYS ET HORACE, LONGIN ET VIRGILE 


Casper C. DE JONGE 


RESUME 

Cet article étudie les liens entre la critique littéraire grecque et la poésie latine d’époque augustéenne. 
Les érudits grecs de la fin de la République et du début de l'Empire sont habituellement étudiés au 
sein d'une tradition purement grecque ; mais beaucoup d'entre eux travaillaient à Rome et savaient 
lire le latin. Ces érudits grecs ne font pas explicitement référence à la poésie latine, mais une analyse 
de leurs discours peut révéler de nombreux paralléles, idées et notions communes, montrant que 
critiques grecs et poètes latins appartiennent à un méme monde intellectuel. L'introduction présente 
une typologie des interactions et connexions entre critique littéraire grecque et littérature latine. 
Elle est suivie de deux études de cas, portant sur Horace et Denys d'Halicarnasse, et sur Virgile 
et Longin, l'auteur du traité Sur le sublime. 


ABSTRACT 


This article examines the connections between Greek literary criticism and Latin poetry of the 
Augustan Age. Greek scholars of the Late Republic and Early Empire are traditionally interpreted 
as part of a purely Greek tradition; but many of them worked in Rome, and many of them were 
able to read Latin. Greek scholars do not explicitly refer to Latin poetry, but a discourse analysis 
can reveal many parallels, common notions and ideas, revealing that Greek critics and Latin 
poets were part of one intellectual world. The introduction presents a typology of interactions and 
connections between Greek literary criticism and Latin literature. The introduction is followed by 
two case studies, one on Horace and Dionysius of Halicarnassus and one on Virgil and Longinus, 
the author of the treatise On the Sublime. 


1. INTRODUCTION 


1.1. Cicéron en Gréce 


C'est en l'an 79 avant J.-C. qu'un jeune homme de vingt-sept ans appelé Marcus Tullius 
Cicéron effectua un voyage en Asie et sur l’île de Rhodes, afin de suivre les enseignements 
des meilleurs philosophes et rhéteurs de la Gréce'. A Rhodes, son professeur de rhéto- 


1. Cet article présente l'introduction et deux études de cas du projet de recherche «Critique littéraire 
grecque et littérature latine : classicisme et interactions culturelles», financé par l'Organisation 
néerlandaise de la recherche scientifique (NWO, 2014-2018). Cette publication conserve, dans 
une certaine mesure, le style oral des conférences que j'ai tenues à Evian-les-Bains en août 2018. 
Trois d'entre elles sont incluses ici : «1. Introduction», «2. Denys et Horace : la composition 
dans la Rome augustéenne » et «3. Longin, Virgile et le sublime silence d' Ajax et de Didon». Une 
premiére version de la seconde conférence («Dionysius and Horace: Composition in Augustan 
Rome») a été publiée en anglais dans R. Hunter et C.C. de Jonge (2019 : 242-266). Je tiens à 
remercier les participants de la session Clélia 2018 pour leurs commentaires et leurs suggestions. 
Je suis extrémement reconnaissant envers Pierre-Alain Caltot, Myriam Diarra, Guillemette Mérot 
et Hamidou Richer pour la traduction de mes conférences en français. 
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rique fut le célébre Apollonios Molon. Plutarque nous a laissé un curieux récit relatant 
la rencontre entre l'étudiant romain et son professeur grec? : 


«On dit qu'Apollonios, qui ne savait pas le latin, le pria de déclamer en grec; Cicéron 
y consentit volontiers, pensant qu'ainsi ses fautes seraient mieux corrigées. Quand il eut 
déclamé, tous les assistants, frappés de son talent, rivalisérent d’éloges ; seul Apollonios 
ne s'était pas déridé en l'écoutant, et, quand Cicéron était peiné de son silence, il dit : “Je 
te loue et t'admire, Cicéron, mais je m'afflige du sort de la Gréce, en constatant que les 
seuls avantages qui nous restaient sont aussi, gráce à toi, passés aux Romains, je veux 
dire : la culture et l'éloquence (ma1dsia Kai AOyos).” » (trad. Flaceliére & Chambry, CUF) 


Cette anecdote plaisante que nous rapporte Plutarque constitue un bon point de départ 
pour cette présentation de quelques réflexions sur les interactions culturelles entre l'éru- 
dition grecque et la littérature latine. Le récit que nous transmet Plutarque au sujet du 
voyage que Cicéron a effectué à Rhodes illustre plusieurs aspects de la relation complexe 
qu'entretiennent Rome et la Grèce au I" siècle avant J.-C. Je commencerai par faire trois 
remarques sur lesquelles il me parait important d'insister. 

Tout d'abord, ce récit présuppose que Rome et la Gréce sont des espaces séparés et distincts, 
et qu'il existe un certain éloignement culturel entre les deux. Dans le récit de Plutarque, ces 
deux espaces se trouvent réunifiés temporairement, tant du point de vue physique que du 
point de vue linguistique. En effet, Cicéron a bel et bien quitté Rome pour se rendre sur l’île 
de Rhodes, afin de rencontrer ses professeurs. De plus, Cicéron étant bilingue (au méme titre 
que tous les Romains de son époque qui ont fait des études), il sait parler en grec lorsqu'il 
s'adresse à un public grec. Dans le cas qui nous occupe à présent, c'est un Romain qui se 
rend en Gréce et qui parle grec ; mais dans d'autres cas de figure, comme nous allons le voir, 
c’est l'inverse qui se produit — j'entends par là que beaucoup de rhéteurs grecs se sont rendus 
à Rome et y ont appris le latin, même s'ils continuent d'écrire leurs traités en grec ancien. 

La deuxiéme remarque qu'il me parait important de faire, c'est que dans la formulation 
même de son récit, qui rapporte la performance rhétorique accomplie par Cicéron sur l’île 
de Rhodes, Plutarque suggère l’idée d'une compétition entre Rome et la Grèce : au début, 
Apollonios est très réticent à l’idée de faire l’éloge d’un orateur romain; mais dans un second 
temps il reconnait (tout en le regrettant par la même occasion) que les Romains, désormais, 
se sont également emparés «de la culture et de l'éloquence» de la Grèce. Du point de vue 
d'Apollonios, il est évident que Cicéron incarne Rome, et que sa performance est alors 
interprétée comme étant la mise en œuvre et l'appropriation romaines de la nadia grecque. 

Le troisiéme élément qu'il me parait important de garder à l'esprit lorsqu'on lit le récit 
de Plutarque, c'est la maniére quelque peu ambigué dont Cicéron est jugé. D'un cóté, nul ne 
saurait nier que cette anecdote tourne à l'avantage de Cicéron, car sa performance a si fortement 
impressionné le public grec qu'il voit là se réaliser une étape majeure de sa carrière, qui n'en 
est qu'à ses débuts — et cette déclamation rhodienne constitue bel et bien un moment clé de 
la biographie que Plutarque consacre à cet orateur romain. Mais, d'un autre cóté, l'échange 
entre Apollonios Molon et Cicéron auquel nous assistons non seulement confirme, mais encore 
réaffirme la supériorité de la Grèce en matière d'éloquence et de culture. En effet, Cicéron 
reçoit l'approbation d’un rhéteur grec, ce qui suggère l'idée que l’orateur romain a besoin 
de recevoir l'aval d'un rhéteur grec avant de pouvoir continuer sa carrière et ainsi devenir le 
plus grand orateur de Rome. Il existe donc une hiérarchie entre le professeur grec et son élève 
romain, dont le succés ou l'échec dépend de l'aptitude qu'il aura à montrer des qualités qui sont 
éminemment grecques (nœdeia kai Adyoc). En d'autres termes, ce n'est qu'en s'appuyant sur 
les attentes linguistiques d'un public grec — donc en transposant en grec ses talents oratoires — 
que Cicéron peut recevoir l'approbation de ce méme public en raison de son immense talent. 


2. Plutarque, Vie de Cicéron, chapitre 4. 
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Tels sont les trois éléments importants que je retiendrai de ce récit : l'éloignement culturel 
entre Rome et la Gréce; le contexte d'une compétition interculturelle et l'ambiguité inhérente 
à la formulation en grec d'un éloge à destination d'un orateur latin. Nous avons ici des 
éléments fondamentaux que nous allons retrouver dans les textes des critiques et des rhéteurs 
grecs de la fin de la République et du début de l’Empire. Je commencerai par me demander 
comment il est possible d'étudier l'interaction culturelle entre la critique littéraire grecque 
et les textes latins, en insistant sur l'importance aussi bien que sur les défis que présente une 
thématique aussi complexe (section 1.2). Je présenterai ensuite (section 1.3) une typologie 
des interactions et des connexions entre la critique littéraire grecque et la littérature latine. 


1.2. Rome et la critique littéraire grecque 


Au cours de mes conférences, je serai amené à évoquer plusieurs auteurs grecs dont nous 
qualifions souvent les écrits de «critique littéraire». Ce concept de «critique littéraire», je 
l'utiliserai dans un sens large, qui peut couvrir tout un ensemble d'activités liées, chez les 
Anciens, à l'interprétation, à l'analyse et à l'évaluation des textes, des auteurs et des genres 
(tant poétiques que prosaiques), ainsi que des théories sur lesquelles étaient fondés les jugements 
critiques. Les Anciens ont formulé ce genre d'observations dans différents contextes, en 
particulier dans les ceuvres rhétoriques, philosophiques, grammaticales et érudites. Au cours 
des deux dernières décennies, un grand nombre d'études ont été consacrées à la critique 
littéraire des Anciens. Nous n'avons jamais été mieux renseignés qu'aujourd'hui sur les 
principes et les méthodes de la théorie rhétorique, sur les approches philosophiques de la 
poésie et sur les commentaires qui nous sont parvenus sous la forme de scholies. Évoquons 
simplement quelques travaux qui ont été publiés au cours des dix dernières années : 


Hunter, R., 2009. Critical Moments in Classical Literature, Cambridge. 

NóNuisr, R., 2009. The Ancient Critic at Work, Cambridge. 

Km, L., 2010. Homer between Fiction and History in Imperial Greek Literature, Cambridge. 

HALLIWELL, S., 2011. Between Ecstasy and Truth. Interpretations of Greek Poetics from 
Homer to Longinus, Oxford. 

Brrro, G., 2012. Lyrik als Philologie : zur Rezeption hellenisticher Pindarkommentierung 
in der Oden des Horaz ; mit einer rhetorisch-literarkritischen Analyse der 
Pindarscholien, Rahden / Westfalen. 

HEATH, M., 2013. Ancient Philosophical Poetics, Cambridge. 

JoLIvET, J.-Chr., 2014. «Exégése homérique et fiction dans la poésie augustéenne », Lalies, 
34, p. 7-74. 

SCHULZ, V., 2014. Die Stimme in der antiken Rhetorik, Gottingen. 

Worman, N., 2015. Landscape and the Spaces of Metaphor in Ancient Literary Theory 
and Criticism, Cambridge. 

PORTER, J.I., 2016. The Sublime in Antiquity, Cambridge. 


Et quelques éditions récentes : 


JANKO, R., 2000. Philodemus, On Poems Book 1, Oxford. 

—, 2010. Philodemus, On Poems Books 3-4, with the Fragments of Aristotle, On Poets, 
Oxford. 

Pontanl, F., 2007-2015. Scholia Graeca in Odysseam. Vol. 1-3. Scholia ad libros a-C, 
Rome. 

WOoERTHER, F., 2015. Caecilius de Calè-Actè. Fragments et Témoignages, Paris. 


L'ensemble de ces titres a de quoi impressionner, et ce à juste titre. Il existe néanmoins un 
aspect de la critique littéraire grecque qui ne semble pas encore avoir reçu autant d'attention 
qu'il le mérite. En effet, une part non négligeable des œuvres écrites en grec (et par «œuvres», 
j'entends les commentaires, ou bien des traités rhétoriques et des essais philosophiques 
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portant sur la poétique) ont été produites dans un monde dominé par la ville de Rome. 
Voici les noms de plusieurs auteurs grecs dont les écrits relévent de la critique littéraire : 


Parthénius de Nicée (1° siècle av. J.-C.) 

Philodéme de Gadara (1° siècle av. J.-C.) 

Denys d'Halicarnasse (fin du 1 siècle av. J.-C.) 

Caecilius de Calè-Actè (fin du 1“ siècle av. J.-C.) 

Pseudo-Longin (1° siècle apr. J.-C. ?) ou Cassius Longin (ur siècle apr. J.-C.) 
Dion de Pruse (env. 40-120 apr. J.-C.) 

Plutarque de Chéronée (env. 46-120 apr. J.-C.) 

Lucien de Samosate (env. 120-180 apr. J.-C.) 

Aelius Aristide (117-181 apr. J.-C.) 

Hermogene de Tarse (fin du ir siècle apr. J.-C.) 


Tous ces auteurs viennent de la partie hellénophone du monde romain. Ils écrivent en grec et 
ils discutent, interpretent et évaluent la littérature grecque appartenant au passé. Philodéme 
de Gadara, par exemple, analyse les qualités uniques de la poésie homérique ; Denys étudie 
les différents styles des orateurs attiques; Longin commente les passages sublimes que 
renferment l'/liade d' Homère, les dialogues de Platon, les discours de Démosthène et les 
poèmes érotiques de Sappho; Dion de Pruse compare les mérites respectifs du Philoctéte 
d'Eschyle, de celui de Sophocle et de celui d'Euripide ; Lucien écrit un traité intitulé 
Comment il faut écrire l'histoire, dans lequel il fait de Thucydide un modèle à suivre pour 
les historiens de son époque; Hermogène a écrit un traité Sur les types de style, dans lequel 
il décrit Ulysse et Démosthéne comme étant les meilleurs des orateurs, car ils maitrisent 
à la perfection le style véhément. En d'autres termes, l'ensemble de ces auteurs sont des 
auteurs grecs qui écrivent en grec sur la littérature grecque du passé. 

Néanmoins, la plupart de ces auteurs étaient en même temps des acteurs à part entière 
de la société romaine. Plutarque et Dion de Pruse s'adressent à leurs patrons romains dans 
certains de leurs écrits ; Denys et Longin ont eu de jeunes Romains pour éléves, et c'est à eux 
qu'ils s'adressent dans leurs traités, tout en leur rappelant leurs exercices quotidiens. Nombre 
d'entre eux, y compris Denys d'Halicarnasse et Plutarque, connaissaient le latin et pouvaient 
lire des sources romaines; certains d'entre eux, comme Parthénios, Philodéme et Denys, ont 
passé à Rome une partie de leur vie. Certains ont même obtenu la citoyenneté romaine et ont 
pris un nom romain, tel Lucius Mestrius Plutarque et Publius Aelius Aristide. Ce dernier a 
écrit un discours Sur Rome, qu'il a prononcé à Rome devant la famille impériale elle-méme. 

Les spécialistes modernes qui ont étudié ces auteurs grecs et les théories littéraires 
qu'ils professent ont pour habitude de les présenter comme faisant partie de la tradition 
grecque : les opinions qu'exposent Denys, Longin et Plutarque sont toujours interprétées 
à partir des écrits antérieurs (mais des écrits grecs) de Platon, d'Aristote, de Théophraste, 
des stoiciens et des grammairiens alexandrins, dans la droite ligne desquels ils s'inscrivent 
de maniére indéniable. Je ne trouve rien à redire à cette approche diachronique, et elle me 
parait même indispensable : la continuité que l'on observe dans la pensée grecque à propos 
de la littérature est bel et bien frappante, au point qu'il n'est guére difficile de trouver 
des échos de Platon ou d'Aristote dans les traités des critiques qui leur sont postérieurs. 
Toutefois, si l'on se restreint à ce type d' examens diachroniques, il est alors inévitable que 
l’on passe à côté d'un autre phénomène important, à savoir la relation synchronique qui 
existe entre la critique littéraire grecque et les textes latins qui lui sont contemporains. Le 
fait d'adopter une telle perspective synchronique s'avére étre une démarche fructueuse : 
voici ce qu'ont bel et bien montré au cours de ces derniéres années les spécialistes qui 
se sont intéressés aux rouleaux de papyrus d’Herculanum, qui contiennent les fragments 
endommagés des œuvres de Philodème de Gadara. Plusieurs spécialistes ont démontré 
que les discussions philosophiques, rhétoriques et littéraires contenues dans ses traités 
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Sur les poémes, Sur la rhétorique, et dans d'autres traités sont liées de trés prés aux 
œuvres latines composées au cours du r* siècle avant J.-C., et en particulier aux œuvres 
de Cicéron, de Lucréce, de Virgile et d' Horace (certains titres sont mentionnés ici) : 


ARMSTRONG, D., FISH, J., JOHNSTON, P.A. & SKINNER, M.B. (éd.), 2004. Vergil, Philodemus 
and the Augustans, Austin. 

AUVRAY-ASSAYAS, C. & DELATTRE, D. (éd.), 2001. Cicéron et Philodéme. La polémique en 
philosophie, Paris. 

Ossink, D. (éd.), 1995. Philodemus and Poetry: Poetic Theory and Practice in Lucretius, 
Philodemus, and Horace, Oxford. 


1.3. La critique littéraire grecque et la littérature latine : interactions et connexions 


Prenant la suite de cette branche des études classiques, le projet de recherche de Leyde 
portant sur «la critique littéraire grecque et la littérature latine» (Greek Literary Criticism 
and Latin Literature: Classicism and Cultural Interaction) s'est concentré, au cours de ces 
derniéres années, sur les critiques littéraires grecs que sont Denys d'Halicarnasse et Longin, 
et sur les liens qu'ils entretiennent avec la théorie et la pratique littéraires que l'on observe 
dans les textes latins. Une généreuse subvention VIDI de la Netherlands Organization of 
Scientific Research (NWO) nous a permis d'examiner ce qu'on pourrait appeler «un dialogue 
interculturel en matière de rhétorique et de critique littéraire». Telle est la thèse défendue 
par notre projet de recherche : que les érudits grecs et les auteurs romains ont été les acteurs 
d'un dialogue ininterrompu, qui a vu un riche échange d'idées et qui a élaboré un discours 
commun sur la poétique, la rhétorique et la critique littéraire. Marianne Schippers soutiendra 
en septembre 2019 sa thèse de doctorat portant sur la théorie de l'imitation littéraire (uiunois 
et imitatio) telle qu'on la trouve énoncée chez le Grec Denys d'Halicarnasse et chez le Romain 
Quintilien ; bientôt, Steven Ooms déposera sa thèse portant sur la théorie que professent 
respectivement Cicéron et Denys d’Halicarnasse sur la composition stylistique ; dans le 
cadre du méme projet de recherche, j'ai étudié les relations entre la théorie littéraire grecque 
et la poésie latine à l'époque augustéenne ; un ouvrage intitulé Dionysius of Halicarnassus 
and Augustan Rome: Rhetoric, Criticism and Historiography, édité par Richard Hunter et 
moi-même, a été publié en 2019 dans la collection «Greek Culture and the Roman World» ?. 
Voici comment je formulerai le sujet de mon projet de recherche : «interactions et 
connexions entre la critique littéraire grecque et les textes latins». C'est à dessein que 
j'emploierai ici le mot «latin» plutôt que le mot «romain», car aussi bien Denys d'Halicarnasse 
que Cicéron peuvent étre appelés des «auteurs romains» : en effet, tous deux ont travaillé 
à Rome et tous deux étaient bilingues, bien que le premier ait écrit ses traités en grec, alors 
que le second a rédigé ses ceuvres (du moins la plupart d'entre elles) en latin. Ce simple 
constat linguistique explique en partie les raisons pour lesquelles les spécialistes modernes 
n'ont pas suffisamment étudié la relation entre ces deux auteurs, car en raison de la nature 
méme des institutions de recherche qui existent aujourd'hui, les chercheurs se concentrent 
exclusivement soit sur les textes grecs, soit sur les textes latins. Si on comprend le mot 
«interaction» comme étant «une action ou une influence réciproques», l'objet de notre 
recherche est de déterminer comment les textes latins ont pu influencer la critique littéraire 
grecque et comment, à l'inverse, la critique littéraire grecque a pu influencer l'écriture de 
textes latins. Le mot «influence» doit étre ici entendu dans le sens le plus large du terme, 
car il désigne tout un jeu de réponses, d'échos et de commentaires. On pourrait penser par 
exemple à des citations explicites, à des réponses dans le cadre d'une polémique, à des 
jeux d'allusion, à des commentaires ironiques, à des stratégies de distanciation ou encore 


3. Hunter & De Jonge (2019). 
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à d'autres formes d'intertextualité et de réception. On pourrait globalement distinguer cinq 
types différents d’interactions entre la critique littéraire grecque et les textes latins. 


1.3.1. Premier type d'interaction : la théorie latine répond à la théorie grecque 


L'un des phénoménes importants qui relévent de cette premiére catégorie réside dans 
l'usage des mots et des concepts grecs dans les traités latins de poétique et de rhétorique. 
Cicéron et Quintilien ne font pas seulement référence aux 1dées développées par les 
théoriciens grecs de l'époque classique comme Isocrate et Aristote, mais ils font aussi 
référence aux théories des rhéteurs grecs qui leur sont contemporains, y compris ceux qui 
ont été leurs professeurs de rhétorique, tel Apollonios Molon que j'ai mentionné au début 
de ma conférence. Il est important de noter que les réponses romaines aux théories des 
Grecs sont en régle générale plus complexes qu'elles n'en ont l'air : en effet, la théorie 
romaine ne se contente pas de reprendre la terminologie grecque, car elle «l'adapte» à 
ses propres fins, et elle souhaite vivement prendre de la distance avec les idées défendues 
par ces Grecs considérés comme « pédants ». On trouve un exemple célébre de ce 
phénomène dans l' Ars Poetica d' Horace, dans lequel ce poète traduit pour un public romain 
l'histoire de la littérature grecque et les concepts littéraires grecs qu'elle a développés. 


1.3.2. Deuxiéme type d'interaction : la pratique latine répond à la théorie grecque 


Différents spécialistes ont défendu l’idée que, lorsqu'il a composé l’Énéide, Virgile a 
eu recours à l’exégèse des poèmes homériques. On pourrait nuancer légèrement la 
formulation de cette idée en disant que l’Énéide donne le sentiment qu'elle s'adresse à 
un public montrant une certaine familiarité avec les «questions homériques », qui sont 
elles aussi discutées dans les scholies à l’//iade et à l'Odyssée. Trois ouvrages méritent 
de ce point de vue d'étre mentionnés tout particuliérement, bien qu'ils n'aillent pas sans 
poser quelques problémes du point de vue de la méthode : 


Jouivet, J.-Chr., 2014. « Exégése homérique et fiction dans la poésie augustéenne », Lalies, 
34, p. 7-74. 

SCHLUNK, R., 1974. The Homeric Scholia and the Aeneid. A Study of the Influence of Ancient 
Homeric Literary Criticism on Vergil, Ann Arbor. 

SCHMIT-NEUERBURG, T., 1999. Vergils Aeneis und die antike Homerexegese. Untersuchungen 
zum Einfluss ethischer und kritischer Homerrezeption auf imitatio und aemulatio 
Vergils, Berlin. 


Dans la troisiéme partie de cette contribution (« Longin, Virgile et le sublime silence 
d'Ajax et de Didon»), nous prendrons une direction légérement différente : nous allons 
explorer les liens qu'entretiennent l' Énéide et le traité Sur le sublime de Longin. Nous ne 
savons pas si le traitement du silence de Didon par Virgile a été influencé par la critique 
homérique grecque ; mais nous savons que Longin et Virgile se sont tous les deux inspirés 
du fameux passage de |’ Odyssée qui dépeint le silence qu’ Ajax oppose à Ulysse. L’accord 
entre un critique grec et un poète latin nous invite à aborder le passage virgilien à partir 
de la théorie rhétorique grecque sur le sublime. 


1.3.3. Troisiéme type d'interaction : la théorie grecque répond à la théorie latine 


Cette troisiéme catégorie demeure un domaine relativement peu étudié, simplement parce 
qu'un certain nombre de spécialistes répugnent encore aujourd'hui à envisager la possibilité 
que des auteurs grecs aient pu une fois de temps en temps apprendre quelque chose de leurs 
collégues écrivant en latin. On nous a appris à considérer que c'est la Gréce qui a influencé 
Rome et non l'inverse. Les choses commencent à peine à bouger, lentement mais sürement, 
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comme l’a montré par exemple le volume récent paru dans la collection des «Entretiens 
de la fondation Hardt» dont le titre est Les Grecs héritiers des Romains*. Pour en revenir à 
la rhétorique et à la critique littéraire, Jakob Wisse a défendu l’idée que l'atticisme, c’est- 
à-dire la volonté d'imiter le style des orateurs attiques, fut un mouvement romain avant 
de devenir un mouvement grec dans un second temps? : C. Licinius Calvus et ses amis se 
qualifiaient eux-mêmes d' Attici, parce qu'ils avaient adopté le style clair et pur de Lysias; 
vingt ans plus tard, des rhéteurs grecs comme Denys d'Halicarnasse et Caecilius ont repris le 
concept d'atticisme, mais en le modifiant et en l'adaptant à leur propre projet, c'est-à-dire en 
présentant différents orateurs attiques comme étant des modèles à imiter : Denys fait l’éloge 
de six d'entre eux, et Caecilius loue un canon de dix orateurs attiques. On peut également 
montrer que les théories cicéroniennes sur la composition stylistique et sur le rythme de la 
prose trouvent un écho direct dans les traités grecs de Denys d’Halicarnasse et de Longin. 


1.3.4. Quatrième type d'interaction : la théorie grecque répond à la pratique latine 


Le silence observé par les critiques grecs à l'égard de la littérature latine est un fait connu 
de tous les antiquisants. Toutefois beaucoup d'auteurs grecs connaissaient le latin et étaient 
capables de lire des textes latins : Denys a par exemple étudié des sources latines pour rédiger 
son histoire de Rome, telles que les écrits de Marcus Terentius Varron et de Quintus Fabius 
Maximus. Serait-il envisageable que Denys, c'est-à-dire un rhéteur habitant à Rome, n'ait 
pas lu au moins quelques discours de Cicéron ou quelques-uns de ses traités? En réalité, 
il existe une remarquable exception à la régle qui veut que la critique grecque passe sous 
silence les auteurs latins : parmi les textes antiques qui sont parvenus jusqu'à nous figure une 
série de comparaisons stylistiques entre Démosthéne et Cicéron‘. Le premier auteur qui ait 
fourni une telle ovy«ptotc entre les deux orateurs n'est autre que le rhéteur grec Caecilius de 
Calè-Actè, qui s'est attiré bon nombre de critiques féroces de la part de ses contemporains : 
pour reprendre les mots de Plutarque, un critique grec qui prétend juger le latin de Cicéron 
n'est qu'un «dauphin évoluant sur la terre ferme », c'est-à-dire un «poisson qui évolue hors 
de l'eau». Toutefois, ce duel fictif qui met aux prises le champion des rhéteurs grecs et le 
meilleur orateur de Rome est devenu un passage obligé de la critique littéraire : Plutarque, 
Longin et Quintilien ont tous écrit leur propre ooykptioic de Démosthène et de Cicéron. 
Dans une autre publication, j'ai analysé la comparaison entre Démosthéne et Cicéron telle 
qu'elle apparait dans les sources grecques. J'ai défendu l'idée qu'une lecture attentive de 
ces passages suggère que Démosthène apparait comme étant le grand vainqueur dans toutes 
les versions grecques de cette obyKptotc’. 


1.3.5. Cinquième type d'interaction : connexions et relations indirectes 


Lorsqu'un auteur grec et un auteur latin évoquent le même sujet, il va de soi qu'il y a au 
moins deux maniéres différentes d'expliquer cette similitude. L'un des deux auteurs peut 
fort bien avoir influencé le second; il est aussi possible qu'ils aient eu recours à une source 
ou à une tradition communes, mais il existe également une troisiéme possibilité : ces 
deux auteurs peuvent aussi avoir appartenu au même univers intellectuel, au sein duquel 
circulaient un certain nombre d'idées, de termes, de valeurs et de théories, que chaque 


. Schubert & Ducrey (2013). 
5. Wisse (1995). 


Caecilius de Calé-Acté T6 Woerther; Longin, Sur le sublime 12, 4-5; Plutarque, Démosthéne 3, 
1-2 et Quintilien 10, 1, 105-112. 


7. De Jonge (2019). 
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auteur a adaptés en fonction de son propre projet personnel. Outre ces «interactions», 
il serait également pertinent de parler de « connexions», c'est-à-dire d'une forme plus 
implicite voire plus indirecte de relation entre les textes grecs et les textes latins, qui ne 
se réduit pas à une relation strictement bilatérale. 


2. DENYS ET HORACE : LA COMPOSITION DANS LA ROME AUGUSTÉENNE 


2.1. Introduction : le traité de Denys sur La Composition stylistique, entre la Gréce 
et Rome 


Le traité majeur de Denys d'Halicarnasse, le IIepi ovv0&oeoG Ovondtwv (Sur lagen- 
cement des mots, ou, plus simplement, La Composition stylistique), est le seul ouvrage 
antique exclusivement consacré au placement stylistique des mots 8. L'exposé que Denys 
conduit de maniére systématique sur les quatre moyens de la composition (mélodie, 
rythme, variété, propriété), les deux finalités de la composition (le charme, 1] oovi, et 
la beauté, tò KaAóv) et les trois types de composition ou «harmonies» (àppiovíat), se 
présente comme un manuel technique adressé aux étudiants de rhétorique. Mais le traité 
diffère des autres ouvrages rhétoriques du fait de son ampleur. Alors que la majorité des 
remarques critiques que Denys déploie dans ses autres ouvrages se concentrent sur l'élo- 
quence attique et l'historiographie, cette œuvre examine un large échantillon de passages 
tirés de la littérature grecque, couvrant ainsi différents genres, périodes et dialectes. Les 
modèles préférés de Denys pour la composition stylistique incluent non seulement des 
auteurs de prose comme Démosthéne (présenté comme le meilleur orateur — et le plus 
complet — dans l'opuscule Sur les anciens orateurs), mais aussi Euripide, Aristophane, 
et des poétes lyriques comme Simonide, l'«austére» Pindare et la « douce» Sappho. 
Toutefois, le champion incontestable de Denys en matiére de composition stylistique est 
Homère : l'7liade et l’ Odyssée sont abondamment citées tout au long du traité. 

Traditionnellement, le traité sur La Composition stylistique est abordé comme un 
produit caractéristique de la tradition rhétorique et critique grecque. Cette perspective 
helléno-centrée est évidemment en accord avec la présentation par Denys de son propre 
projet : il écrit en grec, il cite de la littérature grecque — et non latine — et il s'inscrit dans 
une tradition érudite qui remonte au Cratyle de Platon?. Dans son traité, Denys se référe 
explicitement à plusieurs prédécesseurs grecs ayant développé des théories sur le langage, la 
musique, la métrique et la rhétorique, comme Aristote, Théodecte, Théophraste, Aristoxène, 
Aristophane de Byzance et Chrysippe de Soles '°. Les critiques hellénistiques de la poésie 
ont également influencé la pensée de Denys, bien qu'il ne les mentionne pas : le traité 
sur La Composition stylistique se fonde clairement sur les théories des kritikoi que cite 
Philodéme dans son traité Sur les poémes. Alors que leurs débats sur le sens, le son et la 
composition (ovv@Eotc) se concentrent sur la qualité de la bonne poésie, l'enseignement 
de Denys vise à aider les étudiants à composer une prose efficace et belle : son principal 
souci est le genre du moAttucdc Adyos («éloquence publique») !!. 

Bien qu'il reste important d'étudier Denys en relation avec les conceptions des 
théoriciens grecs précédents, mon exposé souhaite jeter une nouvelle lumiére sur La 


8. Je tiens à remercier Richard Hunter pour les précieuses suggestions qu'il a formulées à la lecture 
d'une précédente version de cette section, qui a été publiée sous le titre « Dionysius and Horace: 
Composition in Augustan Rome», dans Hunter & De Jonge (2019 : 242-266). 


9. DH., Comp. 16, 4 se réfère au Cratyle de Platon comme texte faisant autorité sur les questions liées 
à l'étymologie. 

10. Voir De Jonge (2008 : 34-41) et l'index dans l'édition d'Aujac & Lebel (1981 : 225-228). 

11. DH. Comp. 1,3. Sur les kritikoi que nous connaissons par Philodéme, voir Porter (1995) et Janko (2000). 
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Composition stylistique en adoptant une perspective synchronique et romaine. Denys écrit 
un traité en grec sur l'agencement des mots dans la littérature grecque, mais il le publie à 
Rome, et il l'adresse à un jeune élève romain du nom de Metilius Rufus P. Bien qu'il soit 
centré sur la littérature de la Gréce archaique et classique, le traité sur La Composition 
stylistique est ainsi une œuvre inscrite dans un contexte culturel romain et destinée à un 
public romain. Pour cette raison, nous devons nous interroger sur la facon dont ce traité 
s'insére dans l'environnement intellectuel de la Rome augustéenne. En quoi pouvait-il 
étre utile à l'apprentissage d'un éléve romain comme Metilius Rufus ? L'enseignement 
stylistique de Denys est-il conforme à — voire dialogue-t-il avec — la théorie et la pratique 
des auteurs grecs et latins à Rome? Mon exposé montrera que la critique littéraire de 
Denys peut en effet étre interprétée fructueusement comme étant en interaction avec 
la littérature latine augustéenne. Mon objectif est d'identifier un certain nombre de 
paralléles remarquables entre le langage technique, les présupposés esthétiques et les 
théories littéraires de Denys et d' Horace, deux auteurs actifs à Rome à la méme période, 
tous deux extrêmement intéressés par la nature et les effets du bon style . Le traité sur 
La Composition stylistique est écrit à la fin du 1* siècle avant J.-C., à peu prés à la méme 
période que l’Ars Poetica, que l'on date des années 20 ou 10 avant J.-C. et qui aurait 
pu être la dernière œuvre du poète '*. Nous ne savons pas quelle œuvre a été publiée en 
premier; dans mon exposé, je n’essaierai pas de mettre en lumière une influence directe 
d'une œuvre sur l'autre, mais plutôt de montrer qu'elles s'inscrivent toutes les deux dans 
le contexte des débats littéraires de la Rome augustéenne. 

Certains spécialistes ont déjà décelé des points de contact entre Horace et Denys. Kirk 
Freudenburg a montré que la théorie de la composition stylistique de Denys apporte des 
éclairages nouveaux sur la théorie poétique des Satires, comme nous allons le voir". 
Richard Hunter a démontré qu'il existe des paralléles remarquables entre la théorie 
littéraire de Denys et les Odes d'Horace '*. Leurs conceptions de l' imitation littéraire 
(uipmotc), les analogies qu'ils établissent entre l'écriture et la peinture, ainsi que leurs 
évaluations critiques de Pindare et de Sappho suggérent, comme l'affirme Hunter, que 
Denys et Horace «are in touch with similar streams of criticism ». Il conclut que «further 
close attention to Dionysius may reveal that we can know more about the interaction 
of Augustan criticism and Augustan poetry than is often believed Ÿ». Partant de cette 
suggestion, j'explorerai dans mon exposé la relation entre l’Ars Poetica d'Horace et le 
traité sur La Composition stylistique de Denys, en adoptant la forme d'une ovyKptotc 
dionysienne. La premiére partie de cet exposé présentera une comparaison générale de 
Denys et Horace, rappellera leur place dans la Rome augustéenne, ainsi que leurs théories 
littéraires. La seconde partie se concentrera sur ce que l'on peut appeler le «théme central» 
de la théorie de la composition stylistique chez Denys et chez Horace, à savoir l'idée que 
le style le meilleur et le plus beau est produit par l’habile disposition de mots ordinaires. 


12. DH., Comp. 1, 4. 


13. Fuhrer (2003) montre que la poésie d'Horace peut étre considérée comme le produit d'un débat 
vivant sur la nature de la bonne poésie au 1“ siècle avant J.-C. ; elle mentionne brièvement Denys, 
mais se concentre principalement sur le traité Sur les Poémes de Philodéme. 


14. Le De compositione appartient chronologiquement à la période intermédiaire de la production 
de Denys : voir Bonner (1939 : 25-38). Sur la date de l’Ars Poetica, voir Rudd (1989 : 19-21), 
Frischer (1991 : 17-49) et Reinhardt (2013 : 500). 


15. Freudenburg (1993 : 109-184). 
16. Hunter (2009 : 124-127). 

17. Id. (2009 : 115). 

18. Id. (2009 : 124). 
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2.2. Denys et Horace 


Il ne faut évidemment pas ignorer les différences entre nos deux auteurs et leurs œuvres. 
Le De compositione verborum est un traité de rhétorique technique à la structure 
systématique, qui se concentre sur un aspect spécifique du style (la composition, et non 
l'élocution ou les figures). L’Epitre aux Pisons d' Horace, en revanche, est un poème à 
la structure souple, progressant par associations d'idées, qui aborde une grande variété 
de sujets liés à la composition poétique, comme le contenu, le style et la figure du poéte. 
La nature du genre de l' Ars Poetica prête encore à discussion : épitre, poème didactique, 
ou autre chose ; peut-étre méme la parodie d'un traité péripatéticien ?. Dans son 
commentaire monumental de l' Ars Poetica, Brink met l'accent sur les différences entre 
théorie rhétorique et théorie poétique ??. C'est désormais quasiment un lieu commun 
d'affirmer que l’Ars Poetica, malgré le titre utilisé par Quintilien?!, n'est pas un manuel 
de poétique ?. Aucun lecteur du texte ne niera que le poème d'Horace est beaucoup plus 
qu'un traité sous forme versifiée. Cependant, même en reconnaissant complètement les 
différences formelles entre un poéme latin complexe, subtil et ironique d'une part, et 
un manuel technique grec sur la composition rhétorique d'autre part, il ne faut pas pour 
autant ignorer les correspondances remarquables qui existent entre l’Ars Poetica et les 
traités grecs de rhétorique et de poétique. Plusieurs spécialistes ont en effet déjà repéré 
des parallèles entre l' Ars Poetica et les traités grecs de théorie littéraire contemporains à 
Rome. De nombreux lecteurs sont désormais heureux de comprendre dans quelle mesure 
l'Ars Poetica répond, d’une multiplicité de manières, à l'enseignement de l'ouvrage de 
Philodéme Sur les poèmes *. Doreen Innes a identifié des parallèles de structure entre Ars 
Poetica et le traité de Longin Sur le sublime”. Et, last but not least, Nial Rudd a remarqué 
une étroite ressemblance entre une section spécifique du poéme d' Horace (vers 119-152) 
et l'exposé de Denys sur les tâches de l’historien dans la Lettre à Pompée Géminos *. 

Comparer Denys et Horace n'est en réalité pas aussi absurde que ce que les maigres 
références à Denys dans le commentaire de Brink pourraient laisser penser. Il est vrai que 
Denys écrit principalement pour «tous ceux sans distinction qui s'entrainent à l'éloquence 
publique?6», mais ses exemples de composition plaisante et belle, comme nous l'avons vu, 
sont tirés aussi bien d'ceuvres poétiques que d’ceuvres en prose. Denys affirme à plusieurs 
reprises que ses enseignements sont valables pour les prosateurs et pour les poètes? ; Homère 
est présenté comme le champion de l'agencement des mots ; et les derniers chapitres de son 
traité en particulier explorent les ressemblances entre la belle prose et la poésie”. 

Horace comme Denys sont influencés par les idées aristotéliciennes et hellénistiques sur 
la poésie. Denys s'appuie sur les théories stylistiques de la Rhétorique d' Aristote et du traité 
Sur le Style de Théophraste ; l'Ars Poetica reprend des idées qui nous sont familières grâce à 
la Poétique d' Aristote, même si Horace ne connaissait probablement pas ce texte (et Denys 


19. Voir Frischer (1991 : 87-100) et Hardie (2014 : 43). 

20. Brink (1971 : 139). 

2]. Quint. 8, 3, 60. 

22. Rudd (1989 : 34), Armstrong (1993 : 189) et Laird (2007 : 135). 


23. Voir par exemple Armstrong (1993) et Fuhrer (2003). Janko (2000 : 10) va jusqu'à affirmer : 
«there should be no doubt that Horace had read and absorbed the On Poems. » 


24. Innes (1995 : 111-112). 

25. Rudd (1989 : 22, n. 25). 

26. Comp. 1, 3-4 (trad. Aujac). 
27. Voir par exemple Comp. 3, 1. 
28. Comp. 25-26. 


Critique littéraire grecque et poésie latine : Denys et Horace, Longin et Virgile 97 


non plus)”. L’influence hellénistique sur les deux textes est substantielle, bien que plus 
difficile à évaluer. Dans les études sur Horace et Denys, un érudit grec joue un rôle crucial 
(bien qu'aucun de nos deux auteurs ne le mentionne) : il s'agit du philosophe épicurien, poéte, 
rhétoricien et critique littéraire Philodéme de Gadara (110-135 av. J.-C.), qui étudia à Athènes 
et travailla en Italie à partir de 55 avant J.-C. Les fragments de son ceuvre trés riche ont été 
préservés dans les rouleaux de papyrus endommagés de la Villa dei Papiri à Herculanum. 
L'ceuvre de Philodéme Sur les poèmes, qui polémique avec les kritikoi hellénistiques, s' avérera 
particuliérement éclairante pour notre comparaison entre Denys et Horace. 

Le commentateur Porphyrion nous informe qu'Horace avait assimilé «les principaux 
préceptes » de Néoptoléme de Parium (ur s. av. J.-C.) ?. Néoptoléme est l'un des critiques 
cités dans le traité Sur les Poémes de Philodéme, dont les fragments présentent des points 
de contact significatifs avec l’Ars Poetica et le traité de Denys sur La Composition 
stylistique. Un lien direct entre Philodéme et Horace semble pouvoir étre garanti par le fait 
qu' Horace adresse son poéme à la famille des Pisons : deux iuvenes et leur pére, qui peut 
être identifié soit avec L. Calpurnius Piso Caesoninus, consul en 58 av. J.-C., beau-père de 
Jules César et, ce qui est plus significatif pour notre enquête, patron de Philodéme ; soit 
avec son fils, L. Calpurnius Piso Pontifex, consul en 15 av. J.-C. et patron d'Antipater de 
Thessalonique*!. Un lien clair entre Philodéme et Denys est moins aisé à établir; Denys 
n'a pas beaucoup de sympathie pour «le chœur des épicuriens ?» — ce qui est peut-être 
la raison pour laquelle il garde le silence sur son collègue grec bien connu, légèrement 
plus vieux et respecté parmi les membres de l’élite romaine ; mais il ne fait aucun doute 
que sa théorie de la obvOeotc se construit à partir du travail des critiques qui font l’objet 
des discussions de Philodème dans son ouvrage Sur les poèmes”. 

Tout comme Horace, Denys écrit pour une influente famille romaine : il présente le traité 
sur La Composition stylistique comme un cadeau d'anniversaire pour son étudiant Metilius 
Rufus, qui, comme nous le savons, allait devenir proconsul d'Achaie sous l'empereur 
Auguste“. Le père de Metilius Rufus, dont Denys fait l'éloge en le présentant comme 
«le plus estimé» de ses amis, pourrait avoir été son patron. Bref, le poème d' Horace 
comme le traité de Denys sont profondément ancrés dans le contexte social, culturel et 
politique de la Rome augustéenne. Si l'on peut montrer que ces deux ouvrages s'inscrivent 
en partie dans la méme tradition, alors le Sur les poémes de Philodéme pourrait bien étre 
considéré comme l'un de leurs ancétres communs. 


2.3. Le De compositione verborum et l'Ars poetica 


Considérons à présent certains thémes que le traité sur La Composition stylistique de 
Denys et l’Ars Poetica d' Horace ont en commun. Certains de ces thèmes sont des sujets 


29. Concernant l'influence péripatéticienne sur Denys, voir Bonner (1938); De Jonge (2008 : 34-35). Pour 
l'influence péripatéticienne sur Horace, voir Brink (1963 : 79-134), Reinhardt (2013 : 505-508). Il se 
peut qu'Horace comme Denys aient été familiers du traité Sur les Poètes d' Aristote (aujourd’ hui perdu). 


30. Porphyrion, Comm. in Hor. ad Ars P. I, p. 162, 6-7 Holder : in quem librum congessit praecepta 
Neoptolemi tod Ilapiavod de arte poetica, non quidem omnia sed eminentissima. Voir Brink 
(1963 : 43-78) et Reinhardt (2013 : 504-505). 


31. Lucius Calpurnius Piso Caesoninus : Frischer (1991 : 52-59); Lucius Calpurnius Piso Pontifex : 
Rudd (1989, 19) et Armstrong (1993 : 199-200). 


32. Comp. 24, 8. 


33. Aujac & Lebel (1989 : 39-41), Janko (2000 : 178), Fuhrer (2003 : 256) et De Jonge (2008 : 44-46, 
193-196, 362-365). 


34. Voir Bowersock (1965 : 132). 
35. Comp. 1, 4. 
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traditionnels ou méme des lieux communs de la réflexion rhétorique et critique grecque et 
latine; d'autres parallèles reflètent les centres d'intéréts particuliers au 1" siècle avant J.-C., 
voire peut-étre le goüt littéraire de l'époque augustéenne. Il n'est pas nécessaire de supposer 
qu'Horace et Denys empruntent ces thémes à des sources spécifiques, ni de croire qu'il 
existait une influence directe entre le critique grec et le poéte romain, méme si certaines 
correspondances sont en effet révélatrices. Il suffit, pour les objectifs que nous nous sommes 
fixés, de constater que Denys et Horace participent au même dialogue entre poétique et 
critique littéraire dans la Rome d'Auguste. Les idées, les théories et les valeurs littéraires 
y circulaient de nombreuses façons, impliquant à chaque fois de nombreuses personnes, 
grecques et romaines. D'une part, de nombreux contextes donnaient l'occasion d'un échange 
oral, comme l'enseignement des rhéteurs professionnels (par exemple Denys lui-méme, ou 
quelqu'un comme Apollodore de Pergame, le professeur d’ Auguste) et les cercles littéraires, 
à l'instar des groupes formés autour de Mécène et de Messala, ou le «réseau» auquel Denys 
et ses amis grecs et latins participaient. Je reviendrai sur les destinataires et les collégues de 
Denys à la fin de cet exposé *. D'autre part, les échanges avaient aussi vraisemblablement 
lieu via des textes de différents types (correspondance, poèmes, traités)”. L’Ars Poetica 
et le traité sur La Composition stylistique sont tous deux à la fois des matrices et des 
produits de l'activité littéraire à Rome : nous allons voir que les deux ouvrages abordent 
des thématiques similaires, tout en les traitant de manière différente. 

Je fais une distinction entre quatre catégories de parallèles. La première catégorie 
de parallèles consiste en des idées qu' Horace et Denys partagent avec plusieurs auteurs 
antérieurs (et postérieurs) écrivant sur la rhétorique et la poésie; dans de nombreux cas on 
peut faire remonter ces parallèles jusqu'à Aristote ou à la tradition péripatéticienne. Ces 
thémes incluent le débat bien connu sur le róle de l'art et de la nature (ars et natura ou 
ingenium / poor et t£yvn) dans le processus de création. Aristote avait déjà abordé cette 
question au sujet d' Homère *. Horace et Denys, comme la plupart des critiques, pensent 
qu'il devrait exister un équilibre et une coopération fructueuse entre art et nature ?. Une 
autre idée centrale chez les deux auteurs, également liée à la tradition péripatéticienne, 
est celle du concept important de convenance (aptum, decor / tò npénov). Denys présente 
la convenance comme l'un des quatre moyens de la composition, à cóté de la mélodie, 
du rythme et de la variation ^. Il examine en particulier les maniéres dont la composition 
stylistique (en particulier les motifs vocaux et rythmiques) peuvent exprimer adéquatement 
(c'est-à-dire de manière mimétique) le sujet, comme lorsqu' Homére représente les 
travaux de Sisyphe en recourant à un rythme spondaïque et à des sonorités rudes^'. Denys 
reconnait que d'autres aspects du npénov sont également importants : «la convenance est 
l'adaptation parfaite au sujet, personnage ou fait? » (roig óxokewiévotg TPOGMTOIG TE kai 
mpaypaow). Ainsi, différentes émotions (colère, joie, chagrin, peur) requièrent différents 
types d'agencement des mots (ópyióuevou yaipovtes, dopupôuevot, poBobduevor#). 
La convenance est un concept au moins aussi important dans l' Ars Poetica. Comme Denys, 


36. Surle «réseau» ou le «cercle» de Denys, voir Hidber (1996 : 108) et De Jonge (2008 : 25-34). 
37. Voir Fuhrer (2003 : 352). 

38. Arstt., Poet. 8, 1451a24. 

39. Hor., P. 408-411; DH., Dem. 47, 2; cf. Imit. fr. 1. Voir aussi Longin, Subl. 36, 4 et Ovide, Tr. 2, 424. 
40. Comp. 20. 

41. Comp. 20, 8-22, a propos de Od. 11, 593-597. 

42. Trad. Aujac. 

43. Comp. 20, 3-4. 
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Horace affirme que le schéma métrique doit correspondre au sujet traité“. Ailleurs, il 
souligne que le discours doit être approprié à l’âge des différents personnages? ; et, comme 
Denys, Horace pense que le style doit exprimer les émotions de maniére adéquate : «les 
paroles seront tristes avec un visage affligé, chargées de menaces s’il est irrité, enjouées 
s’il est riant, sérieuses s'il est grave»^*. Le sérieux remplace ici la peur, mais les trois 
autres émotions (tristesse, colére, joie) sont identiques à celles qui sont mentionnées par 
Denys. Le concept de proportion sous-tend également la conception horatienne de l'unité 
poétique, formulée à l'ouverture de l'4rs dans le passage sur la peinture grotesque d'une 
créature dont les parties ne s'accordent pas entre elles”. 

Deux distinctions de base, traditionnelles dans la théorie rhétorique et poétique 
postclassique, relèvent de cette même catégorie des correspondances «péripatéticiennes ». 
Il s'agit tout d'abord de la distinction entre sujet et style, qui remonte à Aristote **. Cette 
distinction est essentielle dans les traités stylistiques de Denys ^, qui sépare les pensées 
(voñuata, ó zpoypatiucóg 16706) des mots (OVOLATA, ó AEKTIKOG TOMOG). Cela correspond 
grosso modo à la division, faite par Néoptoléme de Parium, entre zoinots (contenu, intrigue) 
et noinua (diction, style), dont on pense qu'elle sous-tend la structure de l’Ars Poetica 
(les vers 45 à 118 traitant du style, les vers 119 à 294 traitant du contenu). Plus important 
pour nous : les références explicites d' Horace à la distinction entre res ou materia et 
uerba®. Ensuite, la distinction entre la sélection des mots (ou diction) et l'agencement 
des mots (ou composition), une distinction qui est implicite dans la Rhétorique d' Aristote 
et que Théophraste avait vraisemblablement explicitée dans son traité Sur le style?! 
Le traité de Denys traite uniquement de la composition (o0vOszoic) ; nous ne savons pas s’il 
avait tenu sa promesse d'écrire un traité correspondant sur la sélection des mots (£kAoyr| 
óvopi&tov), qu'il espérait offrir à Metilius Rufus pour son prochain anniversaire?. Horace, 
naturellement, traite à la fois de la diction et de la composition“. 

Lorsque nous nous penchons sur les instructions spécifiques données pour le choix des 
mots et la composition, d'autres parallèles entre Horace et Denys peuvent être détectés. 
Par exemple, les deux auteurs s' intéressent à la formation de mots nouveaux ou innovants, 
et dans ce contexte ils ajoutent tous les deux qu'emprunter des mots inhabituels à des 
auteurs plus anciens peut être plus efficace. Horace concède la licence poétique (licentia) 
de «forger des mots que n'ont pas entendus les Céthégus en tablier» (fingere cinctutis non 
exaudita Cethegis), et ajoute immédiatement que les termes nouveaux seront acceptés plus 
facilement « s'ils jaillissent d'une source grecque» “. Denys affirme que les poètes et les 
auteurs de prose prennent en compte le sujet et «élaborent des mots appropriés au sujet 
traité et qui l'illustrent» (kataoKkevdCovov [...] oiketa kai órActucà TOV DIOKELLEVOV tà 
òvóuata), puis ajoute qu’« ils en empruntent souvent aussi à leurs prédécesseurs » (TOAAG 


44. Hor., P. 73-86; remarquer l'emploi d'aptum au vers 81. 

45. Hor., P. 153-78; noter l'emploi de decor au vers 157 et d'aptis au vers 178. 
46. Hor., P. 105-107 (trad. Villeneuve). 

47. Hor, P 1-5. 

48. Arstt., Rhet. 3, 1, 1403b14-18. 

49. Comp. 1,5. 

50. Je renvoie en particulier aux vers 38 a 41. 


51. Voir Théophraste fr. 691 Fortenbaugh (= DH., /socr. 3). La théorie est implicite chez Aristote, Rhet. 
3, 2-6 (diction) et 3, 8-9 (composition) : voir Forthenbaugh (2005 : 293). 


52. Comp. 1, 8-10. 
53. Je renvoie en particulier à l' Ars Poetica, vers 45-47. 
54. P. 50-53. 
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dé xai Tapa TOV £unpoo0ev Aapfóávovow)?. Ce faisant, ils ne mettent pas l'accent sur le 
méme point : Denys se concentre sur le caractère mimétique du langage, Horace sur les 
néologismes; mais ils affirment tous les deux que c'est la tradition grecque qui donne 
de l'autorité à l'introduction d'expressions inhabituelles. 

Une seconde catégorie de parallèles entre l' 4rs Poetica et le traité sur La Composition 
stylistique est moins liée à l'existence d'une source commune ou à l'inscription au sein 
de la tradition poético-rhétorique qu'au milieu culturel dans lequel évoluent les deux 
auteurs et leur public. Denys comme Horace n’hésitent pas à établir des analogies entre 
l'écriture et les beaux-arts. Ils sont particuliérement friands de comparaisons avec la 
peinture, la musique et la toreutique, dans la mesure où ils s'attendent à ce que leur lectorat 
connaisse la dimension technique de ces arts. Méme dans le détail, ces analogies sont 
remarquablement semblables : Horace compare le poète qui fait des erreurs à «un citharède 
(citharoedus) qui toujours se trompe sur la méme corde» (ridetur chorda qui semper 
oberrat eadem?*). Denys rapporte une histoire semblable : «j'ai vu un bon citharède, de 
grande réputation, se faire huer par le public (ki9apiotijv 0opofn0£vto) pour une seule 
fausse note (yopór|v àobjupovov) qui avait gâté la mélodie?! ». Si Denys a vraiment «vu» 
ce concert décevant (il emploie le mot idav), il est fort probable qu'il ait eu lieu à Rome 
méme, où il y avait en effet un large public disponible pour les performances musicales ; 
Cicéron, dans le De oratore?*, décrit une scène semblable”. En raison de leur immense 
succès, les performances musicales pouvaient aisément servir à illustrer le fonctionnement 
de l'expérience esthétique. Il y a évidemment des différences de détail : Horace estime 
que certaines erreurs sont pardonnables («la corde — chorda — ne rend pas toujours le son 
voulu par la main et par l'esprit»); le citharède de Denys, en revanche, est hué parce 
qu'une seule fausse note a gáché toute la mélodie. Une autre analogie artistique qui lie 
l’Ars poetica et le traité sur La Composition stylistique est celle de la toreutique. Horace 
comme Denys sont d'avis que les écrivains doivent préter attention aux moindres détails, 
et, afin de le prouver, les deux critiques font des comparaisons entre les écrivains et les 
graveurs, qui reproduisent dans le bronze les ongles humains et les boucles de cheveux : 


Aemilium circa ludum faber imus et ungues 

exprimet et molles imitabitur aere capillos, 

infelix operis summa, quia ponere totum 

nesciet. (Hor., P. 32-35) 

«Dans le voisinage de l'école d’Emilius, l'artisan le plus humble rendra les ongles dans 
leurs moindres détails et reproduira dans le bronze la souplesse des cheveux, mécontent du 
résultat parce qu'il ne saura pas représenter l'ensemble.» (trad. Villeneuve, CUF modifiée) 


Denys avait-il en téte les mémes ateliers romains lorsqu'il compare l'attention que 
Démosthène porte à l'euphonie au travail subtil des artisans ? 


[os te yàp pov uol SoKEl npoor]kew àvópi kataokeváCovtt AOYOUG TOAITIKODG 
uvnusia TAG Eavtod óvvápeoc aióvia LNdevos TOV £Xoyiotov OXvyopeiv, À CHypapov 
TE Kal TOPEvT@V nzoiciv ¿v VAN oO0oprtf| yElpav svotoyxias Kai nóvovg ünoóstkvupiévotg 
Tepi TA OAEPia Kai tà ATIAG Kai TOV yvoðv xai TAS TOLADTAS LIKpoAOYyiacs kavotpífe TS 
iéyvno TH aKpiBpetav. (DH., Comp. 25, 35) 


55. Comp. 16, 1. 

56. P 356. 

57. Comp. 11, 8. 

58. De or. 3, 196. 

59. Voir aussi Or. 173. 
60. P 348. 
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«Il est à mon avis beaucoup plus normal, pour un homme qui compose des discours publics 
destinés à devenir des mémoriaux immortels de son propre pouvoir, de ne négliger aucun des 
moindres détails, qu'il ne l'est, pour des peintres et des ciseleurs (Goypóáqov koi Topevtdv 
mo1otv) qui, sur un matériau périssable, veulent montrer l’habileté et le travail de leurs mains, 
d'épuiser la rigueur de leur art sur des veinules, du plumage, du duvet (tà pAéfra Kai tà ntika 
Kai TOV yvobv) ou tout autre détail de ce type.» (trad. Aujac, CUF modifiée)?! 


Les analogies ont des fonctions opposées : Horace souligne que pour la composition 
de l'ensemble il faut plus que de l’habileté à représenter les détails; Denys en revanche 
affirme que méme les plus grands artistes prétent attention aux plus petits détails. Mais 
les exemples (y compris la représentation des cheveux humains) sont empruntés au méme 
domaine, et Denys comme Horace suggèrent tous les deux un contraste hiérarchique entre 
les « pauvres » artisans (on note l'emploi de imus, «le plus pauvre», «le moins réputé») et 
la catégorie plus noble des écrivains : les Pisons et Metilius Rufus doivent étre rattachés, 
évidemment, à ce dernier groupe. 

Cela nous amène au troisième type de parallèles que l'on peut établir entre Horace 
et Denys. Ces parallèles s' expliquent principalement par le caractère didactique de leurs 
ouvrages : les deux auteurs se présentent comme des professeurs patients mais sévéres, qui 
stimulent et encouragent à plusieurs reprises leurs éléves ?. Denys évoque les exercices 
quotidiens du jeune Metilius Rufus 9, Horace adopte la persona d'un professeur — ou 
plutót, comme Frischer l'a affirmé, celle d'un érudit péripatéticien pédant — qui s'adresse 
régulièrement aux deux jeunes Pisons *. Tout professeur veut que ses étudiants travaillent. 
Il ne devrait donc pas être surprenant que la fameuse formule d'Horace, /imae labor 
et mora («le travail lent de la lime»), trouve des parallèles dans l'accent que Denys 
met en permanence sur le travail : il rappelle à ses éléves qu'Isocrate a passé dix ans à 
composer son Panégyrique, et que Platon a réécrit plusieurs fois la premiére phrase de 
la République, jusqu'à obtenir le meilleur résultat 55. 

Notre derniére catégorie de paralléles consiste en quelques correspondances 
remarquables entre des points particuliers des théories de la composition d'Horace et 
de Denys. Ces correspondances ne trouvent pas facilement de paralléles dans les autres 
sources conservées. Il est possible que les théories hellénistiques comme celles des kritikoi 
jouent un róle ici, et nous devrions toujours laisser ouverte la possibilité que de telles idées 
circulaient plus largement à Rome. Je vais mentionner deux de ces paralléles ; le second 
sera examiné plus en détail dans la suite de mon exposé. Un point de contact frappant 
entre Horace et Denys est la distinction qu'ils opérent entre les catégories esthétiques de la 
beauté et du charme. Denys pense que la composition a deux buts, à savoir tò KaAdv et 1| 
ový“. Horace demande que les poèmes ne soient pas juste beaux, mais aussi plaisants : 


Non satis est pulchra esse poemata : dulcia sunto 

et quocumque volent animum auditoris agunto. (Hor., P. 99-100) 

«Ce n'est pas assez que les poèmes soient beaux : ils doivent être plaisants et conduire à 
leur gré l'esprit de l’auditeur. » (trad. Villeneuve, CUF modifiée) 


61. Cf. DH., Dem. 50, 4; 51, 7. 


62. Sur les aspects didactiques de l’Ars Poetica, voir Hardie (2014 : 46); pour ceux du traité sur 
La Composition stylistique, voir Weaire (2012). 


63. DH., Comp. 20, 23; 26, 17. 

64. Frischer (1991 : 99). 

65. Hor., P. 291. Cf. le nóvoc de Callimaque (épigramme 6). 
66. DH., Comp. 25, 32-33. 

67. DH., Comp. 10; cf. DH., Dem. 47. 
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Il est évident qu’ Horace fait allusion à la théorie grecque : animum auditoris agunto, 
comme beaucoup de spécialistes l'ont remarqué, traduit le grec yvyoryoyeiv («conduire 
l'àme»). Les commentateurs ont également identifié l'accord entre Horace et Denys sur la 
finalité esthétique du poème (beauté et charme). Comme souvent, Brink met l'accent sur 
la différence entre l'exposé «technique » de Denys et le fait qu’ Horace se concentre sur les 
émotions 9". Mais, à y regarder de plus prés, la théorie de Denys se révèle assez semblable 
à celle d'Horace. Denys rattache à la beauté (tò koX óv) la grandeur impressionnante, la 
dignité, la solennité, le sérieux, la douceur et des qualités similaires ; le charme (ñ nôovn), 
en revanche, est suscité par l'éclat, la gráce, l'euphonie, la douceur et la persuasion ?. En 
d'autres termes, c'est le charme (ovh) d'un texte qui affecte ou emporte |’ auditeur, tout 
comme l'adjectif dulcia, chez Horace, renvoie aux effets sur l'àme du lecteur. Le terme 
pulchra («well made», Brink ; «formally correct», Rudd) d'autre part dénote la qualité 
formelle intrinséque d'un poéme. Rudd écrit : «a work with this quality alone would be 
impressive in a rather cold and austere way». Cette formulation résume quasiment à 
elle seule la description que fait Denys d'une œuvre qui possède la beauté, mais qui est 
dépourvue de charme ; le critique grec donne l'exemple de Thucydide et d' Antiphon, 
qui manquent de charme ; Hérodote en revanche possède à la fois la beauté et le charme. 

Pour finir, il y a aussi l'idéal d'agencement adroit des mots qui établit un lien étroit 
entre nos deux auteurs "'. Denys et Horace établissent un contraste entre les mots ordinaires 
et communs d'une part, et un agencement des mots ingénieux et «intelligent» d'autre 
part. Dans la derniére section de cette partie (2.7), je défendrai l'idée que l'accent qu'ils 
mettent sur la composition (iunctura, o0vOso1c) est en effet, comme l’a observé Donald 
Russell, «characteristically Augustan ?». 

La typologie des correspondances entre Denys et Horace que nous avons établie n'est 
pas exhaustive. S1 l'on étend le champ de notre investigation au-delà du traité sur La 
Composition stylistique et de l' Ars Poetica, on peut aussi trouver des parallèles entre les 
Odes et les Satires d’ Horace et les autres essais critiques de Denys. Ces correspondances 
incluent des thémes traditionnels, comme la vertu que constituent la clarté et l'unité 
organique ; des considérations critiques sur les auteurs à imiter (parmi lesquels Sappho 
et Pindare, qui sont respectivement les modèles poétiques de la composition polie et de 
la composition austére) et plus spécifiquement le discours sur le sublime. La liste des 
paralléles montre que Denys et Horace sont effectivement, comme Hunter l'a suggéré, 
«in touch with similar streams of criticism ». 


2.4. L'art d'arranger les mots ordinaires : Denys 


Le message central du traité sur La Composition stylistique est que l'agencement habile des 
mots (o0v0soic ou GppLovia) a plus d'impact que la sélection minutieuse des mots (&kAoyr]) : 


TIOAAot yodv Kai romtai Kai ovyypapeis qU.ócoooí te koi pritopeg A&Getg návv kag 
Kai npeno0cag toig VTOKEULÉVOIG EKAECAVTES EXILEADS Appoviav È ATOS amoddvtEs 
sikatav Twa Koi ğuovoov obdév ypNOTOV ünéAavocav ksívov Tod nzóvov. “EtEpot 
Ô EvKATAMPOVNTE kai coget AUBOVTES OVOLATA, GUVOÉVTES 6° ADTA NSEMS koi NEPITTÕG 
NOAM) Tv dppoôirnv TH AOy@ nepi£0nkav. (DH., Comp. 3, 2) 


68. Brink (1971 : 183). Contra Immisch (1932 : 62-75). 
69. DH., Comp. 11, 2. 

70. Rudd (1989 : 167). 

71. Hor., P 47-48 et DH., Comp. 4, 13. 

72. Russell (1973 : 117). 

73. Hunter (2009 : 115). 
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«En tout cas, nombreux sont les poétes et les prosateurs, les philosophes ou les orateurs 
qui ont pris grand soin de choisir des termes (A£&etc) incontestablement beaux et convenant 
au sujet, mais, parce qu'ils les ont inclus dans un ajustement (Gppoviav) de fortune, sans 
gout, ils n'ont retiré aucun profit de tant de peine. D'autres en revanche, qui ont pris des 
mots humbles et bas (svkata@povnta Kai tansıvà ôvéuata), mais les ont composés avec 
agrément et élégance (ovvOévtEcs © atà NOEWS koi TEPITTH<), ont ainsi paré leurs propos 
des mille séductions d' Aphrodite (noAAñv tv äppoôirnv).» (trad. Aujac & Lebel, CUF) 


Denys illustre son propos en citant deux exemples de belle composition qui sont (à son 
avis) produits par l'appariement de mots relativement simples : les vers d'ouverture du 
chant 16 de l'Odyssée"* et l'histoire bien connue de Gygès et de Candaule, empruntée à 
Hérodote . Dans le premier passage, Ulysse, déguisé en mendiant, et Eumée sont en train 
de préparer leur petit-déjeuner dans la cabane du porcher, lorsque soudain Télémaque fait 
son apparition. Selon Denys, ces vers ont un effet enchanteur sur le public, malgré leur 
vocabulaire ordinaire : une poésie plus séduisante n'existe pas. Dans le style didactique 
et interactif qui le caractérise, Denys demande à son lecteur d'identifier les facteurs qui 
conférent au passage homérique sa beauté si enchanteresse : 


Tlod è aùtõv &ouv ý ne Kai ou Ti TOLUDTA otu, TOTEPOV OL TIV &kAoyrv TOV 
OVOLATOV ij Sta Tv oóvOsotv; Ovddsic dv sinoi 01 TV &kAoyr|lv, og yò ne(0opav. die 
yàp TOV EÙTEAEGTÜTOV Kai TaMEWoTaTOV Ovouütov HÉTAEKTOL noa 1| AgEIc, oig üv 
Kai yewpydc Kai ÜoA.attoupyóc Kai yeipotéyvng Kai nüc ó unôepiav dpav tod Aéyew ed 
mowvpEevos €& étoiuov AaBav &yprjoato. AvOÉvtog yodv Tod LETPOV PadAG PAVOETOL 
TÀ QUT TOUTE Kai GCHAG OÙTE yàp LETAMOPAt TIVEG Évetotv EDYEVEIC OÙTE onoAAoyoi 
OÙTE KATAYPHOEIG OUT’ GAAN TpomIKT SiGAEKTOS OddELLIA, ODSE OT] YADTTOL TOAAAL TIVES 
0088 téva À neromuéva òvóuata. Ti oov sineta pi) Odyi TI oovOsotv TOD KdAAODG THC 
épunveiac aitiðoðo ; (DH., Comp. 3, 9-12 sur Hom., Od. 16, 1-16) 

«À quoi tient la force de persuasion (ne106) de ces vers ? Qu'est-ce qui leur donne une telle 
qualité? Est-ce le choix des mots (&kAoyr|v TOV ôvouérov), ou l'effet de la composition 
(o6v0gotv) ? L'on ne saurait invoquer ici le choix des mots, assurément : ce sont les termes 
les plus communs, les plus simples (Tv £0tgAeotávov kai TATELVOTATOV OVOLLETOV), qui 
forment la trame du langage, des mots qu'un paysan, un matelot, un artisan ou n'importe 
qui d'autre qui ne fait aucun cas du beau style aurait employés spontanément. D'ailleurs, 
si l'on brise le mètre (Av@évroc tod uétpov), ces mêmes phrases paraitront banales et 
plates ; elles ne contiennent ni métaphores bien venues, ni hypallages, ni catachréses; on 
n'y trouve pas la moindre trace de langage figuré, guére non plus de termes dialectaux 
(yA@tta1), de mots d'emprunts (éva) ou de néologismes (nenomuéva ôvéuata). Que 
reste-t-il donc, sinon la composition stylistique (oóv0go), pour expliquer la beauté 
formelle de l'expression (tod kGAkovc tfj épunveiag) ? » (trad. Aujac, CUF) 


Denys suggère ici que son outil favori, la metathesis (la modification de l'agencement des 
mots) prouverait que c'est la composition, et non le vocabulaire, qui donne son caractère 
séduisant au passage homérique : si l'on brisait le métre et que l'on détruisait par là la 
o0vOsoic, les mots restants seraient banals (aAo) et indignes d'admiration (G&@Aa)”. Le 
vocabulaire ordinaire du passage homérique correspond au caractère quotidien et prosaique 
de la scéne : les mots employés dans ce passage sont les mots que le porcher Eumée utiliserait 
peut-étre lui-méme, comme n'importe quel « paysan, marin ou artisan». Comme Hunter l'a 
affirmé, la terminologie critique de la distinction sociale employée dans ce passage pourrait 
remonter à la caractérisation d'Euripide (et à sa préférence pour les «choses du quotidien») 


74. DH., Comp. 3, 8. 
75. Hdt., 1, 8-10; DH., Comp. 3, 15. 
76. Surla metathesis, voir De Jonge (2005) et Fuhrer (2003 : 353-360). 
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dans les Grenouilles d' Aristophane ". Dans l'opuscule sur Démosthéne”™, Denys fait une 
distinction semblable entre le langage de l'élite et celui des «hommes qui travaillent sur 
terre et sur mer, et les marchands ordinaires » : ici, Denys recommande l'utilisation du style 
médian, un mélange de grandeur et de simplicité gráce auquel l'orateur peut convaincre à la 
fois les différents niveaux de classes sociales représentées dans son public. Dans le passage 
homérique où s'exprime Eumée, les «mots humbles » semblent être des mots qui dénotent 
des réalités humbles : «cabane» (Koin), « petit-déjeuner» (äpiotov), «vaisselle » (&yygo). 

L'Ulysse déguisé, dont la visite à Eumée fournit à Denys plusieurs exemples d'excellente 
composition, remplit une fonction programmatique dans sa théorie de la composition : 
Denys souligne que la technique de la oóv0gotg pourrait être comparée à l'action de la 
déesse Athéna, qui est capable de changer complétement l'apparence d'Ulysse : 


Kai pot doxsi tic ook Ov GpaptEtv eikácag adtiv TH Opmpikri AOnvà- &ketvr] ve yàp TOV 
'Oàvoo£a TOV ADTOV óvta GAAOTE GAAOTOV ÉTOIEL qaiveoðar, voté LEV jukpóv xoi pucóv 
Kai aioypov 

KTTOXO AevyaA&o &vaAtykuov NOE YÉPOVTL)), 

TOTE 08 TH AVTT pópoo TAAL &oowvapévn 

« ueitová T’ eioióéetv xoi récoova» Oğkev ió$oc0at «KOS 68 küprtog 

ovAac T|ke kóuac vakıvðívo ğvðsı Opoiac». 

AŬTN TE TA axà Xapóévouca OVdLATA TOTE LEV GLOPOA Kai comet. xoi zo. ToLEt 
Qaívgo0at tà vorjuaxa, toté 5’ DwNAG Kai TAOVCIA [Kai dópà] Kai koX. Koi toT’ Àv 
oyeðòv à LdAota SiAAdTtEt TOMTIMG Te nomtoð Koi pütop pńtopoc, 10 cuvtiOÉvat 
del tà ovouato. (DH., Comp. 4, 12-13) 

«On ne se tromperait guére, à mon avis, en imaginant la composition sous les traits de 
l'Athéna d'Homére : prenant Ulysse qui, lui, restait toujours identique à lui-même, cette 
déesse le faisait apparaitre sous mille visages, tantôt flétri, chétif, repoussant : “pareil 
au gueux misérable, ou au vieux" (Od. 16, 273; 17, 202 et 337), tantót, d'un coup de 
la méme baguette, “plus grand et plus fort d'apparence", et “de son front déroulait des 
boucles de cheveux aux reflets d'hyacinthe" (Od. 6, 230-231; 23, 157-158). La composition 
pareillement, prenant les mémes mots, fait paraitre les idées tantót informes, pauvres, 
basses, tantót élevées, riches, belles. Et c'est en cela peut-étre que consiste la différence 
essentielle de poéte à poéte, ou d'orateur à orateur, l'habileté dans l'art de composer 
(tò ovvtWévat dEElO<s TH oóvópuaa). » (trad. Aujac, CUF) 


Un mot particulièrement important dans la dernière phrase est dg&10c : les bons poètes et les 
bons orateurs se reconnaissent au fait qu'ils agencent leurs mots «avec art», «avec savoir- 
faire». Le terme ó£&i6G est employé comme terme critique au moins depuis les Grenouilles 
d'Aristophane ”, où Euripide affirme que le «savoir-faire» (6eñ6tnç) est une des deux 
qualités pour lesquelles un poète devrait être admiré. Denys utilise le terme plus d'une fois 
pour caractériser une composition réussie. Alors qu'il commente l’histoire de Gygès et de 
Candaule rapportée par Hérodote*’, son deuxième exemple principal de composition enchan- 
teresse, Denys remarque que le charme du passage, comme celui de l'extrait de l'Odyssée 
mentionné plus haut?!, est dû au savoir-faire déployé dans l'agencement des mots : la scène 
elle-même est «basse» (tametvov), «dangereuse» (€xucivdvvov) et «plus proche de la 
laideur que de la beauté» (tod aisypod uov Tj Tod KaAOD). Les mots sont aussi bas que 
le contenu auquel ils se réfèrent : ils sont «dépourvus d'art» (ävemtôevt) et «choisis sans 


77. Hunter (2009 : 19). 
78. DH., Dem. 15, 2. 
79. Ar., Ran. 1009. 

80. Hdt. 1, 8-1. 

81. Hom., Od. 16, 1-16. 
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précaution» (ävékkekta). L'histoire, cependant, «a été racontée avec une grande habileté» 
(eipnroi opddpa 626,6) ?, c'est-à-dire que les mots ont été arrangés avec savoir-faire. 


2.5. L'art d'arranger les mots ordinaires : Horace 


Tournons-nous à présent vers Horace, dont la fascination pour une composition exécutée 
avec art est déjà visible dans les Satires. La satire 1, 4 est un poéme complexe, plein 
d'ironie et d'affirmations ambigués. Mon examen du texte sera bref et se concentrera 
sur un passage qui fait écho à certaines idées de Denys que nous venons tout juste de 
rencontrer ?. Horace fait un contraste entre les vers satiriques que Lucilius et lui écrivent, 
d'une part, et la poésie épique d'Ennius d'autre part. A la différence d’Ennius, dont les 
vers consistent en un langage élevé et pompeux, et traitent de thémes épiques et militaires, 
le satiriste compose ses vers avec des mots simples (puris... uerbis). La différence entre 
les genres sera visible, dit Horace, si l'on brise (c'est-à-dire si l'on réarrange) les vers 
(si dissoluas, 55; si soluas, 60) et si l'on enlève les rythmes et les mètres de ces poèmes. 
Dans le cas de la satire, il ne restera rien de poétique, alors que dans le cas de la poésie 
épique d'Ennius, le passage ainsi modifié contiendra toujours des mots élevés et un sujet 
héroïque; on y trouverait toujours «les membres d’un poète démembré » : 


Ergo 
non satis est puris uersum perscribere uerbis 
quem si dissoluas, quiuis stomachetur eodem 
quo personatus pacto pater. His, ego quae nunc, 
olim quae scripsit Lucilius, eripias si 
tempora certa modosque, et quod prius ordine uerbum est 
posterius facias, praeponens ultima primis, 
non, ut si soluas «postquam Discordia taetra 
Belli ferratos postis portasque refregit », 
inuenias etiam disiecti membra poetae. (Hor., Sat. 1, 4, 53-62) 
«Ce n’est donc pas assez d’aller jusqu’au bout du vers en utilisant des mots simples (puris 
uerbis) et tels que, ce vers une fois défait (si dissoluas), le premier père venu gronde du 
même ton que le père de comédie. Si tu ótes à ce que j'écris aujourd'hui, à ce qu'écrivait 
autrefois Lucilius la succession réglée des rythmes et des mètres (eripias si / tempora 
certa modosque), et que tu fasses passer derrière les mots qui venaient d'abord, que tu 
mettes en téte ceux qui étaient à la fin, ce ne sera point comme si tu défaisais (si soluas) 
ces vers : “Quand la noire Discorde eut rompu les portes de la guerre et leurs montants 
de fer" (postquam Discordia taetra / Belli ferratos postis portasque refregit, Enn., An. 
225-226 Sk.); car ici tu retrouverais encore les membres du poéte mis en piéces (disiecti 
membra poetae).» (trad. Villeneuve, CUF modifiée) 


Comme Freudenburg l'a remarqué, ce passage est étroitement lié au sujet du traité sur 
La Composition stylistique ainsi qu'à la méthode de la metathesis que Denys emploie 
fréquemment“. Dans son analyse de l'ouverture du chant 16 de l'Odyssée, comme nous 
l'avons vu, Denys souligne que «si l'on brise le mètre (Av8Evtos Tod uétpov), ces mêmes 
phrases paraitront banales (aa) et plates». Que la persona du satiriste dans la satire 
1, 4 doive être identifiée avec Horace lui-même ou avec l’un de ses critiques (comme le 
suggère Freudenburg), il est clair qu'il applique la même méthode de réagencement : dans 
les deux passages, un sujet bas et une diction simple sont opposés à une composition 
réalisée avec art, sur le plan du mètre et de l'ordre des mots, et les deux critiques se réfèrent 


82. DH., Comp. 3, 14-16. 


83. L'interprétation suivante doit beaucoup à Freudenburg (1993 : 145-150), Armstrong & Oberhelman 
(1995) ainsi que Gowers (2012 : 166-169). 


84. Freudenburg (1993 : 131-132). 
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a la méthode de la metathesis pour prouver que l'agencement des mots est l'étape la plus 
importante de la composition. La syntaxe et l'ordre des mots complexes des vers 53 à 62 
viennent eux-mémes mettre en évidence l'importance cruciale de la composition, méme si 
les propos ironiques d'Horace pourraient être interprétés comme suggérant l’opposé, à savoir 
qu'Ennius n'a pas besoin de l'ordre des mots pour faire de la bonne poésie. La principale 
différence entre le vers d'Ennius et les vers d' Horace est que le premier recourt à un ordre 
des mots simple, presque prosaique, alors que la poésie d'Horace, avec son ordre des mots 
sophistiqué, semble être elle-même le résultat d'une metathesis, c’est-à-dire la modification 
hautement complexe d'un simple texte de prose. Si l'on faisait à nouveau éclater le métre 
des vers d' Horace, il ne subsisterait rien de poétique, puisqu’un ordre des mots élaboré avec 
art est devenu sa principale qualité et la caractéristique de la bonne poésie. 

Horace revient sur la question de l'agencement des mots dans |’Ars Poetica. Voici le 
passage bien connu sur la callida iunctura (l'agencement adroit)  : 


In uerbis etiam tenuis cautusque serendis 

dixeris egregie notum si callida uerbum 

reddiderit iunctura nouum. (Hor., P. 46-48) 

«Apportant, dans l'enchainement des mots aussi, de la délicatesse et de la prudence, on 
écrira avec distinction si, d'un terme courant, on fait par une adroite alliance un terme 
nouveau. » (trad. Villeneuve, CUF) 


Les termes serendis et iunctura sont répétés dans un passage ultérieur de l’Ars Poetica, 
qui porte sur le drame satyrique et son style : 


Ex noto fictum carmen sequar, ut sibi quiuis 

speret idem, sudet multum frustraque laboret 

ausus idem ; tantum series iuncturaque pollet, 

tantum de medio sumptis accedit honoris. (Hor., P. 240-243) 

«Au moyen d'éléments connus, je m'attacherai à façonner mes vers de sorte que chacun 
espère en faire autant, mais ensuite sue et travaille en vain s'il se risque à la même 
entreprise : tant l'ordre et l'agencement ont de prix, tant on peut ajouter d'éclat à des 
termes empruntés à la langue courante. » (trad. Villeneuve, CUF) 


La relation entre les notions de iunctura et de oóv0soig a fait l'objet de débats. Pour 
Immisch, il s'agit de la même chose; Russell suggère un lien fort entre les deux; Brink 
en revanche remarque que la obv@eotc est largement liée à l'euphonie (c'est-à-dire le 
rythme et la mélodie), alors que la iunctura est avant tout un phénomène syntaxique et 
sémantique : un placement astucieux peut donner une signification nouvelle à un mot 
bien connu (par exemple carpe diem)". Tout en étant d'accord avec Brink sur le fait que 
l'attention que Denys porte à la oóv0szoic est différente de celle qu' Horace porte à la 
iunctura, je voudrais attirer l'attention sur quelques correspondances frappantes dans 
leur discours théorique et dans leur approche du placement des mots. 

Quatre aspects de la discussion de la iunctura chez Horace correspondent tout 
particulièrement à certains éléments du traitement de la obvOEotc par Denys. Tout d'abord, 
on conseille au poéte de choisir des mots communs : l'expression «des termes empruntés 
à la langue courante» (de medio sumpta)** peut être comparée à celle que l'on trouve 


85. Voir Armstrong & Oberhelman (1995 : 243-244). 


86. Je conserve l'ordre des vers transmis par les manuscrits, parce que je comprends serendis (46), qui 
anticipe series (242), comme se référant à l'arrangement des mots. Brink (1971 : 134-135) défend 
la transposition de Bentley des vers 46-45. 

87. Immisch (1932 ad loc.), Russell (1973 : 117), Brink (1971 : 139) et Rudd (1989 : 157). Pers. 5, 14 
(iunctura callidus acri) fait écho à l'expression d' Horace. 
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chez Denys («des mots humbles et bas », ebkatappovynta Kai tanetvà Ovonata*’). Horace 
formule cette règle dans sa discussion du drame satyrique?^, mais il ne faut pas supposer 
qu'elle concerne exclusivement ce genre. Comme l'ont remarqué les spécialistes, le style 
loué dans cette section de |’ Ars poetica semble être celui qu’ Horace adopte dans sa propre 
production poétique?! : le drame satyrique est en effet présenté comme un genre à mi-chemin 
entre la tragédie et la comédie, entre le style élevé et le style simple. Les mots de la langue 
courante (de medio sumpta) sont semblables aux « mots simples » qui distinguent la poésie 
d'Horace de celle d'Ennius (pura uerba”). Un vocabulaire élevé ou pompeux est ainsi 
rejeté à la fois par Horace et Denys, mais alors que le Romain semble préférer des mots 
relevant du style médian (de medio sumpta), Denys, comme on l'a vu, est d'avis qu'une belle 
composition peut étre produite méme par un registre de langue bas, c'est-à-dire de mots qui 
sont «humbles et bas». La différence entre les deux auteurs ne devrait pas étre exagérée. 
On peut l'expliquer par les objectifs qui sont ceux de Denys dans les premiers chapitres du 
traité sur La Composition stylistique : l'agencement des mots est tellement efficace, affirme- 
t-il, qu'un beau passage peut étre créé méme à partir des mots humbles d'un fermier ou 
d'un marin. Dans d'autres passages, Denys conseille l'usage de «mots communs», qu'il 
appelle les kópia òvóuata”. Cette expression, qui a un arrière-plan aristotélicien, apparait 
également dans l'Ars Poetica : au vers 234, Horace parle des dominantia nomina, ce qui 
est un pur calque de l'expression Kópia òvóuata”. Les «mots dominants» sont des mots 
courants (à la différence des métaphores, des glossai, etc.) et correspondent à peu près aux 
mots de medio sumpta, aux mots du «langage ordinaire» ^. 

Deuxiémement, les deux auteurs attirent l'attention du lecteur sur l'idée importante de 
«savoir-faire » ou d’«habileté » : Denys, comme nous l'avons vu, considère que les bons 
orateurs et les bons poètes se reconnaissent à leur «habileté dans l’art de composer», tò 
cvvtiBévat sérs và OvOLATA”*. Je voudrais suggérer que cette expression est porteuse 
d'une idée semblable à celle de la callida iunctura que l'on trouve chez Horace”. Tout 
comme le grec 6&6, le latin callidus suppose un savoir-faire pratique : il renvoie à la 
dextérité que l'on acquiert par l'expérience et la pratique °”. 

Troisièmement, Horace comme Denys présentent l'agencement des mots ingénieux 
en des termes qui renvoient à l'opération d'une métamorphose, bien qu'ils le fassent de 
manière différente. Pour Horace, notum devient nouum??; un terme «courant» devient 
un terme « nouveau », une idée rendue par le placement ingénieux des deux mots dans les 
deux vers, alors que pour Denys les mots informes, humbles et bas (Gjtopoa kai tanstvà 
kai ntœyá) sont — exactement comme Ulysse — transformés en mots élevés, riches et 
beaux (DyNAd Kai TAOVOLA Kai xaAó '°°). 
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90. Hor., P. 220-250. 
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Pour finir, il y a le théme de la distinction. Nous avons vu que pour Denys une 
composition adroite est la qualité qui permet à un poéte ou à un orateur de se distinguer 
(StaAA Gttét) d'un autre '?', Horace tient des propos similaires. Il annonce fièrement qu'il 
va, lui, faconner son poéme à partir d'éléments familiers, de sorte que les autres poétes 
vont s'échiner en vain à faire la méme chose : «tant l'ordre et l'agencement ont de prix, 
tant on peut ajouter d'éclat à des termes empruntés à la langue courante '? ». 


2.6. Denys, Horace et la théorie traditionnelle de la composition 


Bien qu'Horace et Denys, comme nous l'avons vu, mettent l'accent sur des points légèrement 
différents (les effets sémantiques du placement des mots pour l'un, l'euphonie harmonieuse 
pour l'autre), ils attachent la méme importance à un agencement des mots efficace (series, 
iunctura, obvOEot<c, appovia). L'idée d'un agencement habile de mots ordinaires semble avoir 
eu un attrait tout particulier pour les auteurs de l'époque augustéenne, mais il ne s'agissait 
en aucun cas d'un concept nouveau. Dans de bréves considérations sur la composition dans 
sa Rhétorique, Aristote recommande déjà de sélectionner des mots du langage ordinaire : 
KAéntetai à’ £0, £àv tig Ek tfjg siœðviaç SiaAgKtov &kAéyov ovvuOfj Step Eopur(óng 
noi Kai VmédE1E MPAtos. (Arstt., Rhet. 3, 2, 1404b24-5) 


«L'art est habilement caché, si l'on assemble entre eux des mots tirés du langage ordinaire. 
C'est ce que fait Euripide, qui, le premier, a montré l'exemple.» 


Alors que la terminologie employée (&kA&yetv et ouvt10éva) anticipe les deux paramètres 
de la théorie stylistique de Denys (&kAoyn et oóv0soic), les mots KAgmteta1 6^ ed semblent 
faire précisément allusion à l'idée d'ingéniosité qu' Horace exprime avec l'adjectif callidus 
et Denys avec l'adverbe de&1a¢'. 

La théorie de la synthesis est ainsi déjà présente en germe chez Aristote. Cependant, 
1l semblerait que le moment décisif pour la composition dans la théorie critique soit le 
I" siècle av. J.-C., dans la Rome de la fin de la République et de l'époque augustéenne. 
Une bonne histoire de la théorie ancienne de la composition, qui reste à écrire, devrait 
examiner les points de contact entre un certain nombre d'auteurs grecs et romains, parmi 
lesquels Philodéme, Cicéron, l'auteur de la Rhétorique à Hérennius, Horace et Denys, 
qui sont tous actifs au r* siècle av. J.-C. 

Puisque la théorie poétique hellénistique a visiblement eu une influence majeure sur 
Horace et sur Denys, l'accent mis sur la oóv0soic dans le traité Sur les poèmes de Philodéme 
est particuliérement intéressant. Un passage de cet ouvrage fait de l'agencement habile 
de mots ordinaires un idéal à atteindre, en des termes qui suggèrent des liens avec les 
passages de Denys et d'Horace déjà mentionnés. Nous ne pouvons pas avoir de certitude 
quant au contexte exact de ce fragment, mais Janko suggére que Philodéme cite ici les 
considérations de Pausimaque, un critique hellénistique '™ : 


Kat qn[ot tò « tw]&àg A&yew ¿x [KOAOV k]oi ZOMTIKOV öv[ouáto]v TO xprotóv i [padov] 
nónpa, Kate [0 GAAovc], Tò TOAAAKIS [eipnpév]ov, pada yt[veo0o1 $]6 iowotwóv [koi && 
e]0TEA@v, ov[y ]keuuévo]v 68 koXGc, x[p]no[1&]. » (Philod., Sur les Poèmes 1 fr. 55 Janko) 
« Certains, dit-il, affirment que les bons ou les mauvais vers naissent de mots beaux et 
poétiques, mais, selon d'autres — ce qui a souvent été dit — de mauvais vers naissent de 
mots communs et ordinaires, mais, arrangés correctement, ces mots donnent naissance à 
de beaux vers.» 
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Cette critique de la poésie recourt aux mémes termes que ceux dont se sert Denys dans 
ses préceptes sur la prose rhétorique (on remarque l'emploi des termes koAóc, padloc, 
ypnotos, etc.). L'idée que la critique de la poésie et la théorie rhétorique de la composition 
étaient étroitement liées entre elles au 1™ siècle av. J.-C. est confirmée lorsque l’on 
compare Cicéron et Horace. Dans l'Orateur ?, Cicéron affirme que, lorsqu'on compose 
des discours, les mots ne devraient pas être sélectionnés en portant une attention particulière 
à l'euphonie, «comme le font les poétes» (ut poetae), mais parce qu'ils sont «empruntés 
au langage ordinaire» (sumpta de medio). Cicéron semble présupposer que la prose 
diffère de la poésie sur ce point. Quelques dizaines d'années plus tard, cependant, Horace 
applique précisément la même expression, sumpta de medio, au langage de la poésie "°. 

La tradition de la théorie de la composition ne s'achéve pas, bien sûr, avec Denys et 
Horace. Il est trés intéressant de noter que Longin, l'auteur du traité Sur le sublime, affirme 
avoir composé un ouvrage séparé [epi ouvOéoecs en deux livres. Quelques aspects de son 
contenu peuvent être déduits de son exposé sur la oóv0soic dans le traité Sur le sublime 
qui présente plusieurs points de contact avec le traité sur La Composition stylistique de 
Denys. Comme Denys, Longin croit que les poétes et les prosateurs peuvent produire un 
effet distingué en combinant ingénieusement les mots entre eux : 


AMÒ uv Stl ye no doi Kai OVYYPAEOV koi romtõv ook óvteg DYNAOI PÜOEL, LMOTE OE 
Kai GpEeysEtc, GUMS kotwoic xai ÔNLHÔEOL toic OVOLAGL kai OLSEV ENAYOLLEVOIC TEPITTOV 
OC TO MOAAG OVYYPOPEVOL, 514 LOVOD TOD ovvVOEival Kai åpuóca taðta T à Sas T Óykov 
Kai Sido LWA Kai TO ur] Tareivoi óokeiv eivai mepieBdAovto. (Lgn., Subl. 40, 2) 

tadta T à uoc T] dEOvtas von Arnim : óoA(oG Immisch : 6&6 De Jonge (2012a) 

« Beaucoup de prosateurs et de poétes, qui ne sont pas sublimes par nature, peut-étre méme 
tout l’opposé, bien qu'ils utilisent la plupart du temps des mots courants, vulgaires et qui ne 
renvoient à rien d'extraordinaire, ont cependant, par le seul agencement et le seul ajustement 
de ceux-ci, réussi à s'arroger la dignité, la distinction et une réputation de grandeur. » 


Même si l'on n'adopte ni la conjecture doAiws («pour tromper»), ni la conjecture 625g 
(«habilement») pour corriger le texte corrompu T 6’ uos t, il est clair que la discussion de 
Longin s'insére sans accrocs dans le réseau de relations que nous avons mis en évidence 
entre Denys et Horace '” : pour Longin, les mots ordinaires et une composition ingénieuse 
mènent non seulement à la distinction (Giäotnua), mais méme au sublime. 


2.7. Conclusion : un goüt augustéen ? 


Mon exposé a mis en lumiére un accord remarquable entre les approches de la compo- 
sition stylistique dans les ouvrages théoriques de Denys et d' Horace. J'ai défendu l'idée 
que leurs conceptions doivent étre envisagées comme étant partie prenante du discours 
littéraire qui lie entre eux divers poètes et critiques grecs et romains résidant à Rome: j'ai 
identifié des traces d'idées similaires dans les fragments et les œuvres de Pausimaque, 
Philodéme, Cicéron et Longin. Il n'est pas possible de reconstruire les relations précises 
entre tous ces auteurs individuels ; comme je l'ai souligné plus haut, il se peut que de 
telles relations aient impliqué à la fois des échanges oraux et une communication écrite. 

Dans le cas de Denys, les différents membres de son cercle littéraire devraient 
évidemment étre pris en compte. Il se peut bien qu'il ait eu des liens avec des intellectuels 
romains via le pére de son étudiant Metilius Rufus, à l'anniversaire duquel nous devons 
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l'existence du traité sur La Composition stylistique. 1l est intéressant de constater que 
les Metilii apparaissent dans les Antiquités romaines "”, ce qui suggère qu'il aurait pu 
exister une relation de patronage entre cette famille et le critique grec. Mais Denys 
échangeait également des idées avec l'éminent avocat et historien Quintus Aelius Tubéron, 
le destinataire de son opuscule sur Thucydide ; Cicéron avait été un ami de son père, 
L. Aelius Tubéron '?. Denys avait également de nombreuses opportunités d'échanger 
avec d'autres rhéteurs grecs : il suffit de nous rappeler ici l'ami de Denys, Caecilius de 
Calé-Acté !!, qui est la cible de Longin dans le traité Sur le sublime. Pour finir, qui sait 
quel rôle d' intermédiaire auraient pu jouer les autres destinataires de Denys dans la Rome 
augustéenne : des lettrés comme Ammée, Démétrios et Pompée Géminos ? 

L'idéal d'un agencement adroit de mots ordinaires semble être spécialement pertinent 
pour les pratiques stylistiques de l'époque augustéenne : une bonne partie des théoriciens 
de la composition mentionnés dans le cours de mon exposé appartiennent à cette période. 
Qu'il y ait eu des liens entre Philodéme et les poétes augustéens fait désormais l'objet d'un 
consensus ; la datation de Longin demeure incertaine, mais des tentatives de le rattacher à 
un contexte augustéen ont effectivement été faites !?. Pourrions-nous aller jusqu'à parler 
d'un goût augustéen en matière de style, c'est-à-dire un goût partagé par les écrivains 
grecs et latins, qu'ils soient critiques, rhéteurs ou poètes ? 

Le secret du style poétique virgilien était déjà analysé, en son temps, en des termes 
qui font écho aux idéaux de Denys et d'Horace. Dans un témoignage trés débattu, Marcus 
Vipsanius Agrippa accuse Virgile d'étre «l'inventeur d'une nouvelle sorte d'affectation 
stylistique (cacozelia), ni boursouflée ni excessivement simple, mais fondée sur des mots 
ordinaires (ex communibus uerbis), et pour cette raison passant inaperçue !?». Comme 
Górler l’a souligné, Agrippa devait faire allusion à la manière remarquable qu'avait 
Virgile d'assembler des mots sans prétention. Les uerba communia de Virgile peuvent 
être comparés aux uerba de medio sumpta d" Horace. Le secret de la poésie virgilienne, 
proche de celui des Odes d' Horace, doit étre cherché dans la collocation et la juxtaposition 
efficace des mots, plutôt que dans le lexique lui-même, qui consiste, comme le remarque 
Gian Biagio Conte, en des termes «not conspicuously poetic, “neutral” words, so to 
speak, employed in prose and the language of everyday usage ^». 

Tout comme il est possible d'établir des points de contact entre Horace et Virgile, 
deux auteurs augustéens qui préfèrent l'usage d'un vocabulaire courant, il est possible de 
déceler des paralléles fascinants entre Virgile et Longin, l'auteur du traité Sur le sublime; 
ce sont ces paralléles qui nous occuperont dans la partie finale de cette contribution. 


3. LONGIN, VIRGILE ET LE SUBLIME SILENCE D? AJAX ET DE DIDON 


3.1. Introduction 


La catabase d’Enée, au chant 6 de l’Énéide, constitue la transition entre la première partie 
odysséenne et la seconde, iliadique, du poème de Virgile ^. La rencontre de Didon et 
d'Enée aux Enfers se trouve placée à l'exact milieu du chant : elle débute au vers 450, sur 


109. DH. 3, 29, 7. 

110. Cic. Lig. 5.12. 

111. DH., Pomp. 3, 20. 

112. Mazzucchi (2010) et De Jonge (2012b). 

113. Don., Verg. 44 : Agrippa à propos de Virgile. Voir Górler (1979), Jocelyn (1979) et Conte (2007). 
114. Conte (1994 : 282). 

115. Virg., En. 6, 450-477. 
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900 vers au total; long de 27 vers, ce court passage constitue l’un des moments les plus 
frappants non seulement de l' Énéide, mais aussi de la littérature latine. Quand il s'adresse 
à Didon, Énée lui fait part de sa profonde affection et de ses remords ; elle, en revanche, 
ne parle pas et se détourne de lui en silence. De nombreux lecteurs et commentateurs ont 
parlé de ce passage crucial qui marque la fin de la liaison entre Didon et Énée, et l'ont 
analysé. T.S. Eliot l'a jugé «non seulement l'un des passages les plus poignants, mais 
aussi l'un des plus raffinés de la poésie [...], complexe dans sa signification et économe 
dans son expression, car il ne nous renseigne pas seulement sur l'attitude de Didon — ce 
qui importe encore davantage, c'est ce qu'il nous dit de l'attitude d'Énée !!6». 

Dans cette section, j'analyserai la rencontre de Didon et d’Enée selon deux perspectives 
différentes, mais liées : d'une part, la théorie grecque ancienne relative à la stylistique ; 
d'autre part, l'analyse linguistique moderne. Si l'on adopte la perspective de la rhétorique 
ancienne, il existe plusieurs raisons, comme nous le verrons, de considérer les 27 vers 
dévolus à Didon et Énée aux Enfers comme un moment «sublime» (Óyoc). D’un point de 
vue moderne, cette même scène peut être envisagée comme un passage «à forte intensité 
émotionnelle» (High Emotional Intensity) — j emprunte cette terminologie à Michael Toolan, 
qui est professeur de littérature anglaise à Birmingham, dont je présenterai plus loin la 
théorie '7. Je vais d'abord me focaliser sur la théorie ancienne du sublime et sa pertinence 
concernant Didon et Enée ; je montrerai ensuite comment la théorie moderne, tout en adoptant 
une nouvelle terminologie, fait écho à certains des principes anciens les plus utiles. Enfin, 
je me consacrerai à 1 'Énéide de Virgile et tenterai d'éclairer d’un jour nouveau les aspects 
stylistiques de l’un des passages les plus bouleversants de la littérature latine. 


3.2. Le traité de Longin Sur le sublime 


Le traité rhétorique grec Sur le sublime est daté entre la fin du 1™ siècle av. J.-C. et le m° siècle 
de notre ére. L'auteur anonyme, que l'on nomme Longin ou Pseudo-Longin, présente son 
œuvre comme un essai sur l'«art» (téyvn ''8) du sublime (Owoc). Après une introduction sur 
la nature du sublime et les fautes stylistiques qui résultent des tentatives manquées d'atteindre 
l'élévation du style, Longin distingue cinq sources (rnyai) du sublime : premièrement, 
«la faculté de concevoir des pensées élevées» (tò nepi tàs vorjostc &ðpenńßoàov), en 
d'autres termes une « grandeur naturelle » qui produit de grandes pensées ; deuxiémement, 
«la véhémence et l'enthousiasme de l'émotion» (oqooópóv Kai £v0ovotaotikóv 1400s) ; 
troisièmement, les figures de pensée et les figures de mots (oynpata AéFews Kai vonoswc) ; 
quatriémement, le choix des mots (&kAoyr] Ovopdtwv); et enfin, l'agencement des termes 
(obv0Eo1c). L'émotion (zó0oc), la deuxième source, ne fait pas l'objet d'un traitement en 
soi, mais les quatre autres sources déterminent la structure du traité Sur le sublime : 

1-2 préface : critique de Caecilius ; bwoc, «excellence et perfection du discours» 

3-5 fautes qui résultent de tentatives manquées d'atteindre le sublime 

6-7 le sublime supporte des lectures répétées et laisse une impression durable 

8 cinq sources du sublime : 

9-15 (1) grandeur des pensées ; 

(2) force de l'émotion ; 
16-29 (3) figures de pensée et de mots ; 


116. T.S. Eliot (1945 : 123) : «not only one of the most poignant, but one of the most civilized passages 
in poetry [...], complex in meaning and economical in expression, for it not only tells us about the 
attitude of Dido — what is still more important is what it tells about the attitude of Aeneas. » 
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30-38 (4) noblesse de l'expression ; 

39-43 (5) agencement des termes 

44 dialogue sur le déclin de la littérature 
Sile développement de Longin sur la premiére source est étroitement lié à la personnalité 
exaltée de l'auteur et à sa capacité à concevoir des thémes et des sujets sublimes (dieux, 
héros, cosmologie, hauteurs immenses et distances énormes), les trois autres sources 
sont liées à des considérations formelles (figures, expression et agencement des mots). 
Mais forme et fond sont toujours étroitement liés dans la rhétorique ancienne, et Longin 
ne fait pas exception en la matière. Parmi ses exemples de «pensées élevées», beaucoup 
sont aussi stylistiquement dérangeants ; réciproquement, bien souvent les figures de mots 
soulignent et illustrent le contenu élevé d'une citation. L'organisation linguistique d'un 
texte peut refléter l'expérience mentale de l'auteur, mais elle peut aussi (et en méme 
temps) refléter la situation et les événements décrits dans la narration. En d'autres termes, 
«le sublime» (Öyoç) décrit l'enthousiasme inspiré de l'auteur, l'expérience extatique du 
public, mais aussi la forme disloquée et le contenu extraordinaire d'un texte; plusieurs 
chapitres du traité Sur le sublime suggérent une connexion et une interaction étroites 
entre ces dimensions transformatrices du sublime. 

Le sublime (Owog : «hauteur, élévation ») est notoirement difficile à définir. Longin 
attend de son destinataire, l’élève romain Postumius Terentianus, qu'il sache déjà que le 
sublime consiste dans «une sorte d'excellence et de perfection du discours» (äkpôtns 
Kai &&oyr tig Aóyov !?). Le terme &&oyr| («distinction» ou «importance ») partage de 
manière significative son préfixe £&/&k- avec éxotaotc et ExmAnétc. Le verbe £& yg 
signifie «se démarquer» ; il est utilisé en particulier au sujet des rochers qui dépassent 
de l’eau '”°. Tout comme le moment sublime d'un texte «se démarque » de son contexte, 
l'auteur sublime s'éléve «au-dessus » de ses collégues, et l'auditeur s'éléve «hors de 
lui-même ». Il s'agit là de différentes manières de «se démarquer» («standing out»), 
C'est certain, mais toutes sont liées à la nature inhabituelle, perturbatrice et désordonnée 
du sublime. Le terme £kotaoig est introduit quand Longin décrit l'impact du sublime : 

Où yap eig MELO TOS äkpoœuévous GAA’ eic £Kotactv üyst TA onepouü- návtr] OE ye oov 
EKTANEEL Tod MOavod Kai TOD TPdc y&ptv ei patei TO Pavudotov, siye TO LEV z0ovóv cg 
TO MTOAAG EM’ HV, TUTO 68 SvVaOTEtAV Kai Biav GpLAYOV npoopépovta TAVTOS £návo TOD 
aKpo@pévov Ka0iotatat. "Y oc dé mov kopios éCevex0Ev T TE npáypata otkrv oKNATOD 
návta StEPOPNOE xai Tv TOD prjtopoc EvOds GOpdav Evedeigato Sbvautv. (Lgn., Subl. 1, 4) 
«Ce n'est pas à la persuasion que le sublime mène l’auditeur, mais au ravissement ; toujours 
et partout l'admiration mélée d'étonnement l'emporte sur ce qui vise à nous persuader et 
à nous plaire. L'action de la persuasion le plus souvent dépend de nous. Il n'en est pas 
ainsi du sublime : il confére au discours un pouvoir, une force irrésistible qui domine 
entièrement l’âme de l'auditeur. [...] Mais quand le sublime vient à éclater où il faut, c'est 
comme la foudre : il disperse tout sur son passage et tout d'abord montre les forces de 
l'orateur concentrées ensemble. » (trad. Lebégue, CUF) 


Ce bref passage est truffé de termes caractéristiques du discours sur le sublime, chez 
Longin comme ailleurs : verticalité, excés, puissance, violence, et mouvement « vers le 
haut» (£n&vo) et «vers l'extérieur» (£k-otaoic, Ëk-rAn&is). Les manuels traditionnels nous 
apprennent que le but de la rhétorique est la £106 (la persuasion), mais Longin vise plus 
loin : «ce qui est par-delà la nature» (tà dnepvû) conduit l’auditoire à l'extase (Ékotaoic). 
Tout, dans cette formulation, indique le mouvement, la dislocation et l'excés. Le préfixe 
nep — dans tà dreppvû suggère la nature excessive de «ce qui pousse au-dessus » du 
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sol, ou pousse «plus haut» que le reste. Comme le terme tyoc lui-même («hauteur », 
«sublimité», «élévation»), tà ónepqvà peut se charger de connotations religieuses, car le 
surhumain est aisément associé au divin. Longin explique plus loin que l’éxotaotc est une 
combinaison de tò 8avpdotov («le merveilleux ») et de PExmAnétc («l'ébahissement»), 
un terme qui évoque de solides rapprochements avec la rhétorique de Gorgias. Force, 
emprise et violence sont caractéristiques de l'extase (kpatet, duvactsiav, Biav äuayov) ; 
l'auditeur est soumis (£návo Tod àkpocopévou kaO(otarat). Verticalité, caractère abrupt, 
puissance et violence convergent dans l'image de l'éclair, qui conclut le passage cité plus 
haut : «quand le sublime vient à éclater où il faut, c'est comme la foudre : il disperse tout 
sur son passage et tout d'abord montre les forces de l'orateur concentrées ensemble. » 


3.3. Homére, Longin et Virgile 


Le concept de sublime (twos, sublimitas) est une notion cruciale qui lie les textes rhéto- 
riques grecs à la littérature latine de l'Empire romain. Ces derniéres années, un nombre 
impressionnant d'études a montré comment le concept de «sublime» créé par Longin 
s’avère, de plusieurs manières, pertinent pour l'étude d'un certain nombre de poètes 
latins : j'aimerais mentionner les importants travaux de James Porter sur Lucrèce, de 
Philip Hardie sur Virgile, d' Alessandro Schiesaro sur Sénéque et de Henry Day sur 
Lucain ?'. Ces spécialistes ont analysé la poésie latine dans la perspective du sublime, 
en se servant des théories non seulement anciennes, mais aussi modernes, de Longin à 
Edmund Burke et Emmanuel Kant. Bien que la ligne de démarcation exacte qui sépare 
Longin des poétes latins demeure quelque peu floue, il est évident qu'il existe des rapports 
intrigants. Il existe bien sür un exemple fameux : le récit par Lucréce d'un naufrage, qui 
est la cause d'un plaisir douloureux (horror ac diuina uoluptas). Ce fameux passage du 
De rerum natura entretient un parallélisme étroit avec les exemples de naufrage issus 
d'Homére et d'Aratos cités dans le chapitre 10 du traité Sur le sublime. On a identifié 
un autre exemple de sublime romain dans les cruelles scénes de la Pharsale de Lucain : 
Henry Day a soutenu que les descriptions détaillées de corps démembrés faites par Lucain 
peuvent être mises en relation avec le chapitre 10 du traité Sur le sublime, où le rhéteur 
grec analyse le fragment 31 de Sappho, un poéme qui décrit les symptómes effrayants 
d'un corps qui se délite sous l'effet de la passion amoureuse. 

Il est un endroit plus évident où chercher dans notre quête de sublime au sein de la poésie 
épique romaine : l’Énéide de Virgile. Un spécialiste a suggéré une connexion entre Longin 
et Virgile : c'est Gian Biagio Conte '”. Il a reconnu dans l'usage fréquent que fait Virgile de 
l'énallage une des caractéristiques principales de son «style sublime». L'analyse de Conte se 
fonde sur d'anciens débats relatifs à l'extraordinaire agencement des mots opéré par Virgile. 
Comme nous l'avons vu ci-dessus, Marcus Vipsanius Agrippa, cité par Donat dans sa Vie 
de Virgile, accusait Virgile d’être «l’inventeur d'une nouvelle sorte d'affectation stylistique 
(cacozelia), ni boursouflée, ni excessivement simple, mais fondée sur des mots ordinaires et de 
ce fait passant inapercue ?». Agrippa semble avoir compris que ce qu'il y a d'extraordinaire 
dans le style de Virgile, c'est le fait qu'il ait choisi des mots ordinaires, communs, usuels, 
qu'il a ensuite arrangés dans des combinaisons inattendues, surprenantes, innovantes. Tandis 
qu'Agrippa a critiqué ce style, d'autres lecteurs anciens semblent l'avoir admiré. Nous avons 
déjà remarqué que les approches rhétoriques grecques de la oóv0goic, non seulement dans le 
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traité sur La Composition stylistique de Denys (qui, tout comme l' Enéide de Virgile, appartient 
à l’époque augustéenne) mais aussi dans le traité Sur le sublime de Longin, où l'«agencement 
[des mots]» est la quatrième source du sublime, louent de la même manière l'art d'agencer 
habilement des mots ordinaires en des compositions surprenantes et enchanteresses. 

Ainsi, il apparait clairement qu'il n'est pas aisé de repérer la nature précise de l'interaction 
entre les critiques grecs et les poétes latins. Il existe toutefois un groupement intrigant de 
passages qui nous permettent vraiment de réfléchir à la relation qui unit critique grecque et 
poésie latine : parfois, il existe un passage spécifique de la littérature grecque (archaique ou 
classique) qui a retenu l'attention d'érudits grecs à Rome d'une part, et celle de poétes latins 
d'autre part ^. La rencontre d'Ulysse et d'Ajax au chant 11 de l'Odyssée constitue un exemple 
appartenant à la catégorie des textes homériques ayant fait l'objet d'une réception favorable 
à la fois dans la critique littéraire grecque et dans la littérature latine. Le commentateur 
Servius avait déjà noté que le silence de Didon en réponse à Énée au chant 6 de I’ Enéide 
était inspiré par le silence d' Ajax en réponse à Ulysse : 

“Oc Épaunv, ó dé p’ OddEV GLEIBETO, PÅ OE LET’ GAAS 

ywoyds sic "Epepog vekóov kaxaveO0vnocov. (Hom., Od. 11, 563-564) . 

«Je dis; mais, sans répondre un mot, l'ombre d’Ajax retournait dans l’Érèbe, prés des 
autres défunts qui dorment dans la mort.» (trad. Bérard, CUF) 


Une scholie grecque à ces vers d' Homére nous dit qu'«il est évident que son silence est 
meilleur que les discours que l'on trouve chez les tragédiens» : ôfAov oov ótt kai TOV 
napà vpayoóoic Xóyov PEATLIOV adtod Å com] ^. Cette remarque concise attire l'attention 
sur la dimension tragique de la réponse d'Ajax à Ulysse, mais suggère également un 
contraste puissant entre discours tragique et silence épique. Dans le traité Sur le sublime, 
on trouve une remarque similaire sur le silence d’ Ajax, qui établit de méme un contraste 
entre «silence» et «discours». Il est toutefois remarquable que Longin choisisse une 
formulation légèrement différente du scholiaste, en remplaçant le comparatif «BéAtiov » 
(«meilleur») par «dynAétepov» («plus sublime») : 


T'éypaqó nov kai EtEPHO1 TO TOLODTOV: Üyoc Leyaloppoodvns åánńynua. 'O0ev Kai povis 
diya Oovpdtetai mote wun Kad’ éavtiv Å čvvoia SV AdTO TO LEYAADEPOV, og À TOD 
Atavtoc £v Nekvig. oo] péya xoi zavtóc DyNAOTEpoOV Aóyov. (Lgn., Subl. 9, 2) 

«Je l'ai écrit ailleurs : le sublime est la résonance d'une grande âme. C'est pourquoi on 
admire parfois une pensée nue, réduite à elle-méme et muette, à cause de cette noblesse 
méme de sentiments. Ainsi le silence d' Ajax dans la Nekyia a ce degré de grandeur auquel 
nul mot ne peut atteindre.» 


On ignore dans quel autre ouvrage (étépw01) Longin a exprimé son avis selon lequel 
«le sublime est la résonance d'une grande âme» (byos Leyaloppoodvns ånńynua). 
Mais cette observation s'insére également parfaitement dans le traité Sur le sublime, 
qui présente la «grandeur d'áme» comme la première et la plus importante source du 
sublime. Le silence d' Ajax montre tout d'abord l'orgueil (ueyaAo@poobvn) du héros lui- 
méme, Ajax, qui n'a pas oublié comme il s'est senti profondément insulté quand c'est 
Ulysse, et non lui, qui a regu les armes du défunt Achille. À un second niveau, toutefois, 
Longin pourrait également suggérer que la réponse silencieuse d’ Ajax est la preuve de 
la «grandeur d'áme» (ueyaAo@poovvn) et de la «grandeur naturelle» (tò ugyoXoqvéc) 
du poète Homère : c'est ce genre de grandeur que les étudiants devraient posséder (et 
développer) afin de devenir des écrivains sublimes. L'un des poétes qui de fait parvinrent 


124. Voir De Jonge (2018) sur la réception du personnage d'Eumée chez Denys et Virgile. 
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a imiter le passage homérique et a rivaliser avec lui — avec ses connotations de grandeur 
et de sublimité — fut Virgile, au chant 6 de l’Énéide. 

Les commentateurs modernes ont noté les similitudes étonnantes qui existent entre 
P Ajax d’Homère et la Didon de Virgile, qui vont bien au-delà de leur silence sublime : les 
deux personnages se suicident ; Ulysse provoque indirectement la mort d' Ajax, tout comme 
Énée provoque le suicide de Didon *, La rencontre d’ Ajax et Ulysse, comme la rencontre 
entre Didon et Énée, compte exactement 27 vers; et les deux passages ont une structure 
tripartite : d'abord, le héros reconnait le fantóme ; ensuite, il s'adresse à lui ou à elle; enfin, 
le fantôme ne répond pas et se détourne. En dehors de |’ Ajax homérique, |’ Ajax tragique 
apparait également comme un modèle pour la Didon de Virgile : comme Conte et d'autres 
l'ont noté, à la fois l'Ajax de Sophocle et la Didon de Virgile prononcent un 7rugrede avant 
de se suicider. Une interprétation possible de ces nombreux paralléles entre Ajax et Didon 
est que Virgile choisit de dépeindre la reine de Carthage comme une fière héroïne du passé, 
qui n'est pas capable de faire face au héros moderne Énée, tout comme le grand Ajax, un 
fier héros du passé, était voué à étre surpassé par un Ulysse moderne, agile et pragmatique. 

Pour notre propos, le rapport entre Longin et Virgile est au moins aussi important que celui 
entre Ajax et Didon. Le critique grec tout comme le poéte latin ont été inspirés, de maniére 
évidente, par le même passage homérique ; ainsi, on pourrait se demander : quel rapport 
Longin entretient-il avec Virgile? Comme je l'ai dit plus haut, le traité Sur le sublime est 
daté entre la fin du r* siècle av. J.-C. et le m° siècle de notre ère. Je suis de ceux qui pensent 
que l'on doit faire remonter la datation relativement tót : Longin pourrait bien appartenir 
au monde augustéen, comme Carlo Maria Mazzucchi l'a proposé ??. Il y a un argument 
solide en faveur de cette datation. Le traité Sur le sublime se présente comme une réponse 
polémique à l'ouvrage (du même titre) écrit par le rhéteur Caecilius de Calè-Actè, qui fut 
de fait actif sous le régne d'Auguste. Caecilius était un ami de Denys d’Halicarnasse, qui 
écrit lui aussi au sujet du sublime dans plusieurs de ses traités. Que Longin ait écrit son 
traité Sur le sublime peu de temps aprés que Caecilius ait publié son ouvrage parait plus 
plausible que d'imaginer que la réponse soit arrivée plusieurs siècles plus tard. Si l'auteur du 
traité Sur le sublime a vécu à l'époque augustéenne, ce serait à peu prés un contemporain de 
Caecilius et de Denys, mais aussi des poétes Horace et Virgile. Nous ne pouvons toutefois 
en être sûrs, et il y a quelques spécialistes qui pensent que Longin appartient à une époque 
bien plus tardive : Malcolm Heath a en effet soutenu que Cassius Longin, le philosophe du 
m? siècle de notre ère, était l’auteur du traité Sur le sublime. 

Ainsi, deux possibilités demeurent. Soit Virgile et Longin sont à peu prés contemporains : 
dans ce cas, la réception de la rencontre d'Ulysse avec Ajax dans le traité Sur le sublime et 
l'Énéide pourrait servir à démontrer que les auteurs grecs et romains de l'époque augustéenne 
partageaient un intérét commun pour un moment homérique aux dimensions sublimes. Soit le 
traité Sur le sublime est postérieur à |’ Énéide : dans ce cas, la référence de Longin au sublime 
silence d’ Ajax pourrait bien avoir rappelé à son destinataire romain Postumius Terentianus 
— et aux autres lecteurs romains — le traitement fait par Virgile de la rencontre entre Didon et 
Énée aux Enfers. Ainsi, dans les deux cas, nous devrions étre incités à appréhender le récit 
de Virgile relatif à Didon et Énée en adoptant le concept de sublime forgé par Longin. Je 
suggérerai qu'outre le silence de Didon, il y a aussi des aspects du style et de la syntaxe de 
Virgile qui contribuent au caractére sublime de la rencontre entre Didon et Énée aux Enfers. 
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Pour Longin, le «sublime» (üyoc, littéralement «hauteur») est un «effet spécial» (comme 
l'a noté Donald Russell) qui apparait habituellement lors de moments brefs, le ko1pdc ou temps 
fort d’un discours ou d'une narration. C'est, comme nous l'avons vu, «quand [il] vient à éclater 
ou il faut, [...] comme la foudre : il disperse tout sur son passage ?». Longin nous invite 
à repérer le sublime lors de moments particuliers au sein du texte : comme le bref passage 
de l'Odyssée sur la réponse silencieuse d’ Ajax à Ulysse, le court passage de l’Énéide sur la 
réponse silencieuse de Didon à Énée est précisément le genre de «temps fort» qui pourrait 
remplir les critères d'un moment sublime, qui «éclate où il faut, [...] comme la foudre»; le 
passage consiste en vingt-sept vers seulement et intervient à un moment crucial de I’ Énéide. 

Dans la structure du traité Sur le sublime, le passage d' Homére sur le silence d' Ajax 
appartient au sens strict à la première source du sublime, la grandeur naturelle (tò LeyaAo@vés), 
qui produit de grandes pensées : le sublime est l'écho de la ugyoXoqpoovn (grandeur 
d’âme). Mais Longin suggère souvent que différentes sources du sublime peuvent fonctionner 
ensemble lors d'un moment spécifique. La rencontre de Didon et Énée est avant tout sublime 
du fait de la grandeur d’âme (ueyañoppocóvn) de la reine de Carthage; mais l'émotion 
(máðoc), la deuxième source du sublime, joue également un rôle important; et il en va de 
même des sources techniques du sublime, qui incluent les figures de mots (oyńuata) comme 
l'hyperbate, les questions et les serments, et l'arrangement des mots (oóv0so1c), qui produit 
des effets à la fois phonétiques et rythmiques. Avant d'examiner plus avant ces dimensions 
sublimes du passage virgilien, tournons-nous un instant vers la théorie moderne. 


3.4. Les passages à forte intensité émotionnelle 


Le «sublime» a recu beaucoup d'attention dans les publications récentes sur la littérature 
ancienne, jusqu'au point culminant que constitue le monumental The Sublime in Antiquity 
de Jim Porter, paru en 2016. Mais le sublime demeure un concept énigmatique et insaisis- 
sable, et il est dés lors compréhensible que les linguistes et narratologues contemporains 
aient mis au point des termes et des concepts différents afin d'analyser les passages les 
plus bouleversants de la littérature. Dans un article récent du journal Style, Rutger Allan, 
Irene de Jong et moi-méme avons soutenu que le concept moderne d'«immersion» est 
lié aux notions anciennes d'enargeia et d'enagónios, qui jouent aussi un róle important 
dans le traité Sur le sublime de Longin ?. Un article récent de Michael Toolan explore 
plus avant la notion d' « immersion», en s’intéressant aux passages «les plus immersifs » 
dans les nouvelles, qu'il appelle aussi des «passages à haut risque» et «qui impliquent 
le plus fortement le lecteur», des «pics émotionnels de l’histoire», et des passages FIE 
(à «Forte Intensité Emotionnelle») ?'. Toolan pose la question suivante : 


How does a poem, story, novel, or play cause a reader to empathize, feel moved, immersed, 

or involved at particular points in the text? What is it in the texture of the story, in its use of 
certain kinds of language and not in other kinds, that is instrumental in the reader $ sense 
of emotional immersion? (Toolan 2012 : 211) 


Je ne veux pas suggérer que Toolan est un Longin moderne, car il existe des différences 
importantes ; en particulier, Toolan se focalise sur des nouvelles en anglais, alors que 
Longin se penche sur la poésie, la rhétorique et l’historiographie grecques. Mais j'aimerais 
faire remarquer qu'il existe des parallèles évidents entre les moments sublimes (bwoc) de 
Longin et les «passages à forte intensité émotionnelle» de Toolan. D'abord, le critique 
ancien tout comme le linguiste moderne se focalisent sur de brefs moments au sein d'une 


129. Lgn., Subl. 1, 4. 
130. Allan, De Jong & De Jonge (2016). 
131. Toolan (2012). 
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narration plus vaste (Longin parle d’un «sublime [qui] éclat[e] [...] comme la foudre», 
Toolan d’«endroits particuliers du texte»). Ensuite, Longin comme Toolan emploient 
la métaphore verticale de la hauteur et de l'élévation (twos et «pics émotionnels »). 
Troisiémement, ils s’intéressent tous les deux en priorité à l'investissement et à l'impli- 
cation du public (£kotaoig et investissement), et les deux spécialistes octroient un rôle 
important à l'émotion, ou 7480c. Enfin, Longin tout comme Toolan dressent la liste d'un 
certain nombre d'aspects stylistiques et grammaticaux des textes qui peuvent étre utilisés 
pour identifier et analyser ces moments émouvants de la narration. La liste de Toolan 
correspond en partie aux développements de Longin sur les sources techniques du sublime : 


1. Key projecting verbs are think and see, feel and want. 

2. Negation is widespread. 

3. Sentence grammar is comparatively elaborate, complex; or sentences are longer; etc. 
4. Standard sentence grammar may be departed from; sentences may border on the 
ungrammatical. 

5. More temporal simultaneity. 

6. Heat, light and dimension words are prominent. 

7. Absolute / ultimate words are used. 

8. A higher density of lexical and structural repetition [...]. In effect, the passages are 
highly rhetorically crafted. The lexical repetitions may make links with lexis (thus 
situations) from earlier in the story, etc. (Toolan 2012 : 218-219) 


Par exemple, le troisiéme point de Toolan stipule que, dans les passages qui suscitent 
le plus d'implication chez le public, «la grammaire des phrases est comparativement 
élaborée et complexe; ou les phrases sont plus longues » ; le quatrième point dit que «l’on 
peut s'écarter de la grammaire ordinaire de la phrase; et [que] les phrases peuvent fróler 
l'agrammaticalité ». Ces observations sur les passages à forte intensité émotionnelle dans 
les nouvelles en anglais peuvent étre aisément comparées aux observations de Longin sur 
l’hyperbate, l'asyndéte et les figures grammaticales, qui se démarquent de la grammaire 
logique en employant le singulier au lieu du pluriel, le présent au lieu du passé ou la 
deuxième personne au lieu de la première. La remarque de Toolan sur la «plus grande 
densité de répétition lexicale et structurelle» (point 8) correspond aux considérations de 
Longin sur le róle de l'anaphore et des répétitions dans les narrations sublimes. 

Ces correspondances entre théorie ancienne et moderne pourraient nous aider à penser 
la dimension stylistique du traitement par Virgile de la rencontre de Didon et Énée au 
chant 6 de l’Énéide. Long de seulement 27 vers, le passage remplit à la fois les critères 
d'un moment de «sublime» et d'un «passage à forte intensité émotionnelle». Que la 
scène puisse être de fait qualifiée de «sublime» d'un point de vue ancien est en outre 
suggéré par le fait qu'elle imite la rencontre homérique entre Ajax et Ulysse aux Enfers, 
avec un silence qui s’avère (selon les mots de Longin) «plus sublime que tout discours ». 
Examinons donc le style sublime de Virgile au chant 6 de l’Énéide, vers 450-476. 


3.5. Le style sublime de Il’ Énéide, 6, 450-476 


Différents commentateurs ont produit de fines observations sur le style de ce passage, 
parmi lesquels Norden, Austin et plus récemment Horsfall '?. Mon but ici n'est bien sûr 
pas de répéter leurs commentaires, mais plutót de me pencher sur certains aspects 
stylistiques de ce passage dans la perspective du sublime ancien d'une part, et, de l'autre, 
dans celle de la théorie moderne de l'immersion. Du fait des contraintes de temps, je 
me concentrerai sur quelques aspects. La première partie de ce passage décrit comment 


132. Norden (1934), Austin (1977) et Horsfall (2013). 
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Enée, aprés qu'il a vu sept héroines du passé, reconnait soudainement Didon, qui arrive 
«en produisant un effet dramatique» (comme le note Austin) : 


Inter quas Phoenissa recens a uulnere Dido 

errabat silua in magna; quam Troius heros 

ut primum iuxta stetit agnouitque per umbras 

obscuram, qualem primo qui surgere mense 

aut uidet aut uidisse putat per nubila lunam, 

demisit lacrimas dulcique adfatus amore est. (Virg., En. 6, 450-455) 

« Parmi elles, la Phénicienne, toute récente de sa blessure, Didon, errait dans la grande forét. 
Dès que le héros troyen fut prés d'elle et la reconnut parmi les ombres, obscure — ainsi la 
lune qu'au début du mois un homme voit ou croit avoir vue émerger entre les nuages -, il 
laissa couler ses larmes, en doux amour il lui parla.» (trad. Perret, CUF) 


L'apparition de Didon n'est pas sans rappeler les épiphanies divines du chapitre 9 du traité 
Sur le sublime, oà Longin cite plusieurs descriptions homériques de dieux et de héros, qui 
incluent, de fait, Ajax appelant de ses prières la lumière au milieu du champ de bataille : 
AyXoóg pva kai vdé &zopog abt Tv tõv "EAAnvov énéyer uáxnv: ÉvOa 51) ó Aíag 
åunyavõv 
«Zed nátep (pnoiv), GALA od põou dr’ Hépos vias Ayav 
noinoov č’ aiOpry, 006 à’ OPOaALOIoW idéo0at- 
£v è pásı Kai OAEGGOV. » 
"Eottv Os &An0@c tò n600c Aiavtoc, (Lgn., Subl. 9, 10) 
« Une obscurité soudaine, une nuit insurmontable arrétent pour lui le combat des Grecs. 
A ce moment, Ajax, dans sa détresse : 
“Zeus, pére des dieux (dit-il), 6 toi, délivre de ce brouillard les fils des Achéens ; 
fais le ciel serein, permets à leurs yeux de voir; 
mais à la lumière au moins fais-nous périr.” 
Voilà véritablement les sentiments d'un Ajax.» 


Ajax appelle de ses priéres le soleil au milieu du brouillard ; Didon apparait telle une 
lune au milieu des nuages. Le contraste entre la lumière et l'obscurité apparaît ainsi 
pertinent à la fois pour l'Ajax de Longin et la Didon de Virgile. De tels contrastes sont 
aussi notables dans d'autres passages du traité Sur le sublime : Longin associe souvent le 
caractére sublime avec le soleil, les éclairs, ou la luminosité des étoiles célestes. Je note 
en passant que Toolan observe de méme que les mots relatifs à «la chaleur, la lumière et 
la dimension» prédominent dans ce qu'il appelle les passages à forte intensité émotionnelle. 
Le verbe crucial «voir » — l’un des principaux «projecting verbs» du point 1 de la liste 
de Toolan '* — est utilisé deux fois au vers 454 (aut uidet aut uidisse) au sujet de la 
perception de la lune, qui «s'éléve» (453) au milieu des nuages : surgere est un terme qui 
appartient au discours latin du sublime, exprimant un mouvement vertical d'élévation. 
Bien des commentateurs ont observé que la comparaison lunaire de Virgile s’inspirait 
du chant 4 des Argonautiques d’ Apollonios de Rhodes, où Lyncée voit Hercule «tel une 
lune » dans la distance brumeuse "^. Mais la lune est aussi un corps céleste sublime qui va 
de pair avec l'intérét de Longin pour le soleil, les étoiles et les «feux célestes». 

Des facteurs plus techniques de caractére sublime pourraient étre identifiés dans la 
composition (obvOEotc) et les figures (oyńuata) du passage de Virgile. Les spondées du 
vers 451 (errabat silua in magna quam) expriment une « douloureuse agitation», selon le 
commentateur Austin '?; mais l'on pourrait aussi citer Denys d'Halicarnasse (contemporain 
de Virgile à Rome), qui déclare que le spondée «possède une grande dignité (à&(cpo) et 


133. Toolan (2012 : 218-219). 
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beaucoup de majesté (oeuvótno) 7^». L'agencement des mots de Virgile aux vers 451-452 
est remarquable : l'anastrophe de quam... juxta (séparés par la fin du vers) «confine à 
la non-grammaticalité », pourrait-on dire comme Longin et Toolan. L’enjambement de 
obscuram (453) attire l'attention sur le contraste entre clair et obscur; et la postposition 
de lunam en fin de proposition renforce le suspense (comme le note Austin), suscitant 
de la sorte l'investissement et l'implication du public 7. 

Dans la deuxiéme partie du passage, Énée s'adresse à Didon : 


« Infelix Dido, uerus mihi nuntius ergo 

uenerat exstinctam ferroque extrema secutam ? 

Funeris heu tibi causa fui ? Per sidera iuro, 

per superos et si qua fides tellure sub ima est, 

inuitus, regina, tuo de litore cessi. 

Sed me iussa deum, quae nunc has ire per umbras, 

per loca senta situ cogunt noctemque profundam, 

imperiis egere suis ; nec credere quiui 

hunc tantum tibi me discessu ferre dolorem. 

Siste gradum teque aspectu ne subtrahe nostro. 

Quem fugis ? Extremum fato quod te adloquor hoc est. » (Virg., En. 6, 456-466) 
«“Malheureuse Didon, c'était vrai, je le vois, ce qu'on m'avait conté, que tu avais renversé 
ton flambeau, scellé ton destin par le fer. La cause de ta mort, hélas! fut-ce moi? J'en jure 
par les étoiles, par les dieux d'en haut et s'il est quelque foi au profond de la terre, j'ai quitté 
ton rivage, 6 reine, malgré moi. Mais les ordres des dieux, qui maintenant me forcent d'aller 
à travers ces ombres, par ces lieux rongés de décrépitude, par cette nuit profonde, m'ont poussé 
de toute leur puissance; et je n'ai pu croire que par mon départ je te portais une si grande 
douleur. Arrête ta marche, ne te soustrais pas à notre présence. Devant qui t'enfuis-tu? 
La dernière fois que le destin me donne de te parler, c'est maintenant." » (trad. Perret, CUF) 


Infelix Dido (456), de nouveau avec de lourds spondées, fait écho non seulement à la 
description de la reine faite plus tót par le narrateur, mais aussi aux mots avec lesquels Didon 
se décrivait elle-même lorsqu'elle mourait au chant 4 P*. Il y a une autre allusion intra- 
textuelle au chant 4 de l’Énéide avec quem fugis (466) — mais cette fois-ci, ce n'est pas Enée, 
mais Didon qui se détourne "°. Enée interroge Didon : «La cause de ta mort, hélas ! fut-ce 
moi?» (458, Funeris heu tibi causa fui ?). Longin remarque que «les figures de demande 
et d'interrogation» donnent au discours «plus de véhémence et d'efficacité» 4°. Dans son 
traitement des questions, Longin emploie aussi le terme technique &vayóvioc, qui implique 
que le public s’investit et s’implique activement, ou s'«immerge », grâce à cette figure. 
Longin caractérise une autre figure, le serment, comme un facteur potentiel de sublime : 
son propre exemple *! concerne le fameux serment de Marathon de Démosthéne, qui est bien 
sûr très différent de la promesse d' Énée aux vers 458-460. Mais la promesse d'Énée, elle 
aussi, pourrait-on dire de concert avec Longin, «change le tour naturel de l'argumentation 
en une expression sublime et pathétique au plus haut degré (oreppóAX.ov üyoc kai ná00c)». 
«Tout serment ne comporte pas de grandeur par lui-même », fait observer Longin; «c'est le 
lieu, la manière, les circonstances, la cause qui en font le prix (tò è mod Kai tg Kai p’ OV 
KaIp@v Kai Tivos Éveko)) » '**. Suivons le conseil de Longin et prenons en compte le lieu, la 


136. DH., Comp. 17, 4. 
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manière, les circonstances et la cause du serment d' Énée. Le lieu (tò 88 200), les Enfers, est 
de fait extraordinaire. Enée prête aussi serment d'une manière extraordinaire (tò mc), «par 
les étoiles, par les dieux d'en haut et s'il est quelque foi au profond de la terre», donnant 
ainsi à son serment une dimension «sublime» de verticalité : les «étoiles» sont considérées 
(comme on l'a déjà noté) comme des corps célestes «élevés», non seulement par Longin, 
mais aussi par Lucrèce et Horace. Le moment du serment (&' v koipóv) est aussi unique, 
parce qu'il intervient à un moment crucial de l’Énéide, et que ce sera manifestement la 
dernière fois qu'Énée et Didon se rencontrent. La motivation d’Enée (tivoc évexa) réside 
dans le profond remords qu'il éprouve quand il se trouve face à sa Didon bien-aimée. Il 
semble alors que tous les critéres de Longin soient remplis : le serment d'Énée peut de fait 
être considéré comme sublime, lorsque l'on observe le lieu, la manière, les circonstances 
et la cause (tò 88 nod Kai tc Kai åp’ Ov KaIpOv Kai tivos Éveko). 

Le passage contient aussi des caractéristiques plus techniques qui contribuent à son 
caractére sublime. On peut identifier dans les derniéres paroles d’Enée (vers 466) un 
effet significatif de la obv@so1c, avec un «un rythme haché provoqué par l'élision du 
monosyllabe te et les deux monosyllabes du sixième pied #», dont le caractère abrupt 
nous prépare au sublime silence de Didon. Plus haut, il y a plusieurs figures qui (dans 
la terminologie ancienne) «se démarquent de l'ordre grammatical logique». J'attire 
particuliérement l'attention sur le vers 464, ou la séparation des mots hunc... dolorem 
pourrait nous rappeler les observations de Longin sur l'hyperbate : 

Tfjg dÈ abtijc ió$ag Kai tà DaEpBata Detéov. "Ecuv dé AéEEWV ij VONOEWV EK TOD 
KaT’ üKoAovO(av kekivnuévy TAEIC Kai otovei YAPAKTHP Evaywviov rélovs GANnVEoTATOG. 
(Lgn., Subl. 22, 1) 

«Dans la méme catégorie il nous faut ranger l'hyperbate. Cette figure consiste dans un 


ordre qui dissocie les mots ou les pensées de leur suite naturelle, et constitue, pour ainsi 
dire, le caractére le plus vrai d'une passion violente.» (trad. Lebégue, CUF) 


L'emploi par Longin du mot évay@vtoc indique que l'hyperbate suscite l'investissement, 
l'implication et, pourrait-on dire, «l'immersion» du public dans la narration #. 

Intéressons-nous enfin au silence de Didon lui-méme, dans la troisiéme partie du 
passage de Virgile : 


Talibus Aeneas ardentem et torua tuentem 

lenibat dictis animum lacrimasque ciebat. 

Illa solo fixos oculos auersa tenebat 

nec magis incepto uultum sermone mouetur 

quam si dura silex aut stet Marpesia cautes. 

Tandem corripuit sese atque inimica refugit 

in nemus umbriferum, coniunx ubi pristinus illi 

respondet curis aequatque Sychaeus amorem. 

Nec minus Aeneas casu percussus iniquo 

prosequitur lacrimis longe et miseratur euntem. (Virg., En. 6, 467-476) 

«Par ces mots, Enée tentait d'adoucir ce cœur brûlant, ce regard farouche, d'émouvoir 
des larmes. Elle, s'étant détournée, tenait ses yeux fixés au sol et à cet essai d'entretien 
ne marque pas dans son visage plus de sentiment que si dur silex elle était ou que füt 
là debout un marbre de Marpessos. Enfin elle s'arracha et hostile s'enfuit dans le bois 
plein d'ombre où l'époux de jadis, Sychée, s'accorde à cette peine et y égale son amour. 
Et cependant Énée, touché au cœur par l’injustice de ce sort, la suit de loin, les yeux en 
larmes, plein de pitié tandis qu'elle va.» (trad. Perret, CUF) 


143. Williams (1972 : 488) : «a broken rhythm caused by the elision of the monosyllabic te and by the 
two monosyllables in the sixth foot». 
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Le silence de Didon imite la grandeur d'esprit (u£yaAoppoodvn) de |’ Ajax d’Homère : en 
résistant à toute communication verbale, qui caractérise les étres humains, elle semble avoir 
adopté une attitude suprahumaine ; en ce sens, son silence, comme celui d’ Ajax, est « grand 
et plus élevé que tout discours » (uéya koi ztavtóg dynAétepov Aóyov). Mais dans ce passage 
aussi, il y a davantage de signes de sublime, notamment des traits stylistiques que Longin 
inclut dans son développement sur les figures grammaticales «osées », et les effets acoustiques 
de l'agencement frappant des mots. Au vers 467 on a de nouveau un verbe de «vision» dans 
torua tuentem («au regard farouche »), mais le plus important est que ces mots s'appliquent, 
de manière frappante, à l'animum : «Dido $ mind comes to the window of her eyes», comme 
le note Austin; Norden explique cette «personnification osée» comme une occurrence de 
la A&&s tragique grecque #. On pourrait encore citer Longin, qui nous dit qu'«il est dans la 
nature du sublime et du pathétique [...] d'exiger comme absolument nécessaire la hardiesse 
des métaphores; ils ne laissent pas à l'auditeur le loisir d'en examiner le nombre à cause de 
l'enthousiasme qu'il partage avec l'orateur (tù 10 ovvevÂðovoðv TH Aéyovu). ^5» 

Le vers 468 (lenibat dictis animum lacrimasque ciebat) se caractérise par une allitération 
(lenibat, lacrimas), l'abondance des voyelles et des homéotéleutes (/enibat, ciebat) : 
Norden affirme que ces effets expriment de facon mimétique les tentatives d’Enée pour 
adoucir et apaiser la colère de Didon 7, Cela s'accorderait encore avec la théorie ancienne 
(comme Norden le note en fait lui-même) : Denys d'Halicarnasse nous dit que «le À 
[lambda] cause de l'agrément [à l'oreille], c'est la plus douce des semi-voyelles >>. On 
peut de fait y opposer la dureté des sons [s] et [k] au vers 471 (quam si dura silex aut stet 
Marpesia cautes) : Denys caractérise ces sons comme «totalement dépourvu[s] de gráce 
et d'agrément (&yapí te kai àmó£co), et pouvant même blesser (Avrei) ». 

Lorsque l'on passe d'une perspective rhétorique ancienne à une perspective linguistique 
moderne dans l'étude de Virgile, on peut identifier plusieurs des caractéristiques de 
l'élévation émotionnelle de Toolan dans le texte. Il y a des particularités grammaticales, 
comme mouetur uultum au vers 470 (Longin pourrait nommer cette construction un 
«passif pour un actif», l'une de ses figures grammaticales du sublime). Au vers 471 le 
monosyllabe stet se trouve dans une construction apo koinou par rapport à la fois à silex 
et à cautes. On peut aussi noter les négations au vers 475 (nec minus, iniquo); et il y a 
une répétition subtile quand les véritables Jacrimae d’Enée au vers 476 font écho aux 
lacrimae du vers 468 (où Didon, toutefois, ne pleure pas). 


3.6. Conclusion 


On pourrait évidemment en dire bien davantage sur la rencontre d’Enée et de Didon aux 
Enfers, un passage extrêmement intense et émouvant dans l' Énéide. La théorie stylistique 
ancienne tout autant que la théorie linguistique moderne nous aident à comprendre pourquoi 
ce moment particulier de l' Énéide provoque chez le lecteur de l’empathie, le fait de se 
sentir ému et «en immersion ». Nous avons mis au jour plusieurs facteurs grammaticaux, 
phonétiques et rythmiques, qui renforcent le moment sublime du silence de Didon, une 
sublime imitation du silence d' Ajax dans l’Odyssée. Toutes ces caractéristiques contribuent 
à notre immersion dans ce « passage à forte intensité émotionnelle» au sein de la narration 
virgilienne. Ou, pour le dire avec les mots des Anciens, ces caractéristiques textuelles 
font que nous vivons la rencontre d'Énée et de Didon comme un moment de sublime, 
qui ne nous méne «pas à la persuasion [...], mais au ravissement». 


145. Austin (1977 : 165-166) et Norden (1934 : 255). 
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L'ODE III, 28 D'HORACE ET LE GENRE DE LA NÉNIE 


Cécile TEP 


RÉSUMÉ 

L'ode III, 28 d'Horace, adressée à Lydé à l'occasion de la féte des Neptunalia, a toutes les 
caractéristiques d'une ode symposiaque et s'inscrit parfaitement dans la construction des trois 
premiers livres des Odes. Une lecture approfondie de l'ode permet toutefois de cerner sa complexité 
générique. L'analyse métrique du poéme, composé en distiques combinant asclépiade mineur et 
glyconique, et l'étude de son rythme accentuel mettent ainsi en évidence le glissement qui a lieu 
dans le déroulement du poéme vers le genre de la nénie. 


ABSTRACT 


The Ode 3.28, adressed to Lyde as an invitation to join the poet during the Neptunalia, gathers 
the main features of a traditional sympotic ode and has a prominent position in the structure of 
the Tribiblos. However, a closer reading reveals the generic ambivalence of the ode. This paper is 
based upon a study of the metrical issues and the accentual pattern of the poem, which are linked 
to the characteristics of the Fourth Asclepiadean, in order to highlight the shift operated in the 
ode between sympotic poetry and nenia. 


1. INTRODUCTION : L'ASCLÉPIADE MINEUR ET L?AMBIGUITE GÉNÉRIQUE DANS L^ODE III, 28 


Cette étude de l'ode III, 28 d' Horace se propose d'examiner le rapport complexe du poème 
aux genres littéraires en s'appuyant particuliérement sur des observations métriques et 
rythmiques. Trois genres littéraires sont explicitement évoqués au cours du poème et sont 
intégrés dans son déroulement : celui de la poésie symposiaque tout d'abord puisque l'ode 
s'ouvre sur une exhortation du poéte en direction de Lydé à venir boire et chanter pour 
fêter les Neptunalia, puis celui de l'hymne, et enfin celui de la nénie qui clôt le poème. 


Festo quid potius die 1 
Neptuni faciam ? Prome reconditum, 
Lyde, strenua Caecubum 
munitaeque adhibe uim sapientiae. 
Inclinare meridiem 5 
sentis ac, ueluti stet uolucris dies, 
parcis deripere horreo 
cessantem Bibuli consulis amphoram ? 
Nos cantabimus inuicem 
Neptunum et uirides Nereidum comas 10 
tu curua recines lyra 
Latonam et celeris spicula Cynthiae ; 
summo carmine, quae Cnidon 
fulgentesque tenet Cycladas et Paphum 
iunctis uisit oloribus. 15 
Dicetur merita Nox quoque nenia. (Hor., O. III, 28) 
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« Que pourrais-je faire de mieux le jour 

où l’on fête Neptune ? Tire de sa retraite, 

Lydé, le Cécube sans tarder 

et renforce les fortifications de ta sagesse. 

Le midi qui décline, 

tu le vois, et, comme si le jour suspendait son vol, 
tu t'abstiens d'arracher à son cellier 

l'amphore laissée au repos depuis Bibulus ? 

Moi, je chanterai quand ce sera mon tour 
Neptune et les cheveux verts des Néréides, 

toi, tu diras en réponse, sur ta lyre courbe, 

Latone et les traits de la Cynthienne rapide; 

notre dernier chant sera pour celle qui 

règne sur Cnide, sur les Cyclades brillantes et visite 
Paphos avec son attelage de cygnes. 

La Nuit aussi aura la nénie qu'elle mérite.» 


L'ode se construit en deux grands mouvements de longueur égale : les quatre premiers 
distiques sont consacrés à la mise en place des références symposiaques et à l'invitation 
à boire le vin et les quatre derniers distiques mettent en scène le rapprochement des deux 
personnages avec une récitation alternée d’hymnes en l'honneur de plusieurs divinités. 
Les lieux de la poésie symposiaque et les références à d’autres traditions littéraires, l’hymne 
et la nénie, sont intégrés dans cette logique d’alternance et de réciprocité. Cette variété 
générique est sans doute permise par les caractéristiques des vers qui composent le poème. 

L’ode est écrite en distiques combinant deux types de vers lyriques : le glyconique et 
l’asclépiade mineur. Le distique prend la forme suivante : 


UYU U 


UU UU U 


L’asclépiade mineur est un vers de douze syllabes hérité de la lyrique grecque, en 
particulier de Sappho et d’Alcée, qui en sont les représentants les plus emblématiques. 
On considère généralement qu’ Horace est à l'origine de la normalisation du vers et de son 
intégration à la poésie latine?. Alors que la base du vers était indifférente dans la poésie 
grecque, elle est spondaique chez Horace. La diérése aprés la sixiéme syllabe devient 
également obligatoire?. On obtient donc le schéma suivant : 


Uu—//—wuwu—u 


Toutefois, les grammairiens latins, tout comme les métriciens modernes, ont débattu 
sur l'analyse de ce vers. Si le vers grec est sans doute issu de l'expansion choriambique 
de l'octosyllabe glyconique, le vers latin a pu être analysé comme un dérivé des vers 
dactyliques par les grammairiens latins. On lui a ainsi prété une analyse choriambique, 
dactylique ou encore antispastique, certains grammairiens proposant plusieurs de ces 
hypothèses en même temps“. Cette ambiguïté est particulièrement propice à la mise en 


Les traductions des textes latins sont personnelles, sauf indication contraire. 


2. Heinze (1918 : 251) suggére qu'en réalité la normalisation de l'asclépiade mineur est sans doute 
issue d'un processus entamé à l'époque alexandrine par le poéte Asclépiade, qui aurait ainsi donné 
son nom au vers. 

3. On note deux exceptions dans les Odes : II, 12, 25 et IV, 8, 17. 

4. Sil'onsuit l'hypothése de Meillet (1923), qui propose de remonter à une origine indo-européenne 
des vers lyriques. Ces vers ont sans doute une origine beaucoup plus ancienne que leur emploi dans 
la poésie grecque. 

5. Becker (2016 : 292) signale que les grammairiens latins donnaient trois analyses principales de 
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place d'un grand nombre de jeux génériques. En effet, le vers ayant une structure métrique 
fixe, l'arrangement des mots et les rythmes accentuels permettent de créer des effets 
de rythme et de variation. Certains arrangements peuvent mettre en avant une parenté 
avec l'hexamétre dactylique et créer un rapprochement avec la poésie épique tandis que 
d'autres jouent au contraire sur les origines choriambiques du vers. 

Les poèmes en asclépiade mineur occupent une position importante dans les Odes. Ainsi, 
on peut noter que des odes jouant sur l'ambiguité générique sont placées à des endroits 
clés du recueil. Utilisé dans 509 vers et dans 34 poèmes sur 103, l'asclépiade mineur est, 
en effet, le deuxième mètre le plus employé par Horace derrière les mètres alcaiques. 
C'est aussi le vers qui ouvre le recueil et, si l'on considére uniquement les trois premiers 
livres, qui le referme. Cependant, il ne se comporte pas exactement de la méme manière 
que les metres alcaiques et sapphiques, qui sont les deux autres mètres lyriques les plus 
fréquemment employés dans les Odes. Contrairement à eux, il peut être employé Kata 
o1(yov^ ou en composition avec d'autres vers sous forme de strophe ou de distique, ce qui 
permet un nombre beaucoup plus important de combinaisons, dans le cadre de la strophe 
asclépiade A, qui comprend trois asclépiades mineurs et un glyconique, et de la strophe 
asclépiade B, constituée de deux asclépiades mineurs, un phérécratéen puis un glyconique. 

L'asclépiade mineur semble donc étre un vers dépourvu d'une identité clairement 
définie, qui se préte de ce fait volontiers à l'introduction de divers genres littéraires. 
L'ode III, 28 méle ainsi plusieurs genres littéraires selon des modalités variées. Alors que 
l'inclusion du genre de l'hymne avec le style qui lui est propre est aisément repérable et 
clairement délimitée, la nénie fait l'objet d'un glissement générique plus subtil qui invite 
à relire tout le poéme en faisant attention à son rythme accentuel. 


2. SUJET SYMPOSIAQUE ET ESTHÉTIQUE DE LA COMPLÉMENTARITÉ 


Le premier mouvement du poéme permet tout d'abord la mise en place d'un certain nombre 
de références symposiaques. Elles font écho à d'autres poémes aux thématiques similaires 
que l'on trouve en divers endroits des Odes, et plus particuliérement à la fin du livre I. 

Le livre I se clôt en effet par un triptyque symposiaque : l’ode I, 36 en distiques 
formés d'un asclépiade mineur et d'un glyconique, suivie de l'ode I, 37 (le fameux 
nunc est bibendum) en strophes alcaiques, et enfin l'ode I, 38, en strophes sapphiques. 
Ainsi, la fin du premier livre des Odes est marquée par une variation autour d'un méme 
théme sur des modes différents avec l'emploi successif des trois métres lyriques les plus 
représentés dans le recueil et s'achéve sur le mot bibentem (I, 38, 8). Le parallèle entre 
cette configuration et celle du livre III est remarquable. L'ode III, 30, qui clót à la fois le 
livre et l'ensemble du 7ribiblos, reprend des éléments de l’ode I, 1 et est écrite dans le 
même mètre : l'asclépiade mineur employé katà otiyov. Elle est précédée de deux odes 
trés différentes mais dont on peut noter la continuité thématique : l’ode III, 28 se présente 
comme une ode symposiaque trés courte tandis que l'ode III, 29 est une trés longue ode 
philosophique s'ouvrant toutefois sur une invitation adressée à Mécéne à partager un 
repas et à boire du vin. Comme l'ode I, 36, l'ode III, 28 est l'antépénultiéme du livre et 
est écrite en distiques mélant asclépiade mineur et glyconique. 


l'asclépiade mineur : une choriambique (Priscien, Dioméde ou encore Marius Plotus Sacerdotus), 
une dactylique (Julien de Toléde) et une antispastique (Aphtonius). Mais il précise également que 
la plupart des grammairiens font apparaitre plusieurs de ces analyses : ainsi Aphtonius ou encore 
Julien de Toléde proposent à la fois une analyse choriambique et dactylique. 


6. Le schéma métrique se répéte toujours d'un vers sur l'autre. Autrement dit, le vers n'est pas 
employé dans une composition (strophique, par exemple). 


128 Cécile Tep 


Il parait ainsi intéressant de dresser un bref paralléle entre ces deux odes qui ont pour 
traits communs la représentation d'une scène symposiaque, leur place antépénultième 
dans leur livre respectif et, enfin, le fait de partager le même mètre. L'ode I, 36 joue selon 
Robin Glinatsis un rôle particulier de «poéme-modeéle 7». Certaines odes seraient en effet 
remarquables par le catalogue qu'elles offrent de tous les éléments qui caractérisent un 
motif ou un genre littéraire. Ce « haut degré de généricité?» est renforcé, dans l'ode I, 36, 
par le caractère injonctif du poème qui, en plus d’être un exemple de scène de banquet, 
permet de dresser un «art poétique du banquet? », qui a une valeur rhétorique. En partant 
du modèle générique donné par l’ode I, 36, nous pouvons constater que l’ode III, 28 
possède également un nombre important des caractéristiques topiques du banquet. Elle 
reprend l'évocation des circonstances de production du poéme, la présence du vin et du 
chant, ainsi qu'une dimension érotique. Le vin, élément central d'une scéne symposiaque, 
est évoqué dès les vers 2 et 3 : 


[...] prome reconditum, 
Lyde, strenua Caecubum. 


L'expression prome Caecubum apparait comme une variante de celle que l’on trouve 
dans l'ode I, 37, qui est une des odes symposiaques les plus emblématiques du recueil : 


Antehac nefas depromere Caecubum 
cellis auitis [...] (Hor., O. I, 37, 5-6) 
«Avant ce jour il était sacrilège de tirer le Cécube des celliers ancestraux » 


En utilisant une expression semblable, l'ode III, 28 s'inscrit bien dans un réseau d'odes 
symposiaques qui se caractérise par la reprise d'un vocabulaire commun mais aussi de 
lieux facilement identifiables, à l'image de celui de la háte qui doit accompagner l'action 
de retirer le vin du cellier et dont nous avons un exemple dans l'ode IV, 12? : 


Verum pone moras et studium lucri (Hor., O. IV, 12, 25) 
«Laisse là les retards et le souci du gain.» 


Le chant, ou du moins la récitation d'hymnes, vient s'ajouter au cadre des festivités 

à partir du vers 9, tandis que la présence de Lydé, dont le rôle est assimilé à celui de 
l'hétaire, permet de mettre en place une thématique érotique typiquement symposiaque 
également. Dans l'ode I, 27 par exemple, le poéte, invité à un banquet, interrompt une 
dispute en demandant à l'un des convives des détails sur ses amours. On note enfin que, 
comme dans la plupart des odes d'inspiration symposiaque, l'occasion de la production 
du poème est mentionnée : il s'agissait du retour de Numida d'Espagne dans l’ode I, 36 
ou de la victoire d'Actium dans l’ode I, 37 et, dans l’ode III, 28, il est question de la fête 
des Neptunalia dès les premiers vers du poème : 

—— — Uu— u— 

Festo quid potius die 

Neptuni | faciam? [...] 


Le substantif die et son épithéte festo encadrent de manière significative le premier vers 
et l'importance des festivités semble étre soulignée par le rejet au vers suivant qui met 
en valeur le nom de Neptune, divinité honorée à l'occasion des Neptunalia. La tradition 


Glinatsis (2012 : 62-73). 
Id. (2012 : 62). 
. Ibid. 
10. Cet exemple est donné par Davis (2016 : 279). 
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était, lors de cette ancienne féte populaire célébrée le 23 juillet, de se réunir à l'extérieur, 
sous des huttes de feuillage "'. 

Un autre trait caractéristique du début de l'ode est la référence à la sagesse, qui lie 
thématiquement ce poème à d'autres odes symposiaques. En effet, comme l'a souligné 
Gregson Davis "^, il semble que les odes symposiaques soient souvent liées à une dimension 
morale et philosophique. Il voit dans le vers 4 l'expression d'une éthique du symposion, 
que l'on retrouve en particulier dans lode I, 11, écrite en asclépiade majeur, et considère 
que la traduction de adhibe uim par «faire violence à» la sagesse est un contresens. 
Il faut au contraire lire cette injonction comme une invitation à fortifier la sagesse de 
Lydé. Cette lecture est selon lui permise par la référence aux autres odes symposiaques 
qui présentent le motif du carpe diem : la consommation de vin n'est pas une action qui 
va à l'encontre de la sagesse mais qui fait au contraire partie de la conception horatienne 
de la sagesse. L’asclépiade majeur étant une variation de l'asclépiade mineur, qui se 
retrouve augmenté d'un choriambe, le lien entre les mètres utilisés dans ces deux poèmes 
souligne leur proximité thématique et philosophique. Enfin, la place particuliére du mot 
sapientiae au vers 4 vient étayer cette analyse : 


——— Uu -— /} UU—U 
Munitaequ(e)adhibe uim sapientiae 


Non seulement le mot est mis en valeur par sa place en fin de vers, mais sa longueur est 
remarquable dans un asclépiade mineur, qui ne se termine que dans 2 % des cas par un 
mot de cinq syllabes. Cette configuration viendrait donc souligner l'importance de ce 
terme qui fait écho à d'autres poémes symposiaques. 

On peut donc observer une série de ressemblances entre la situation symposiaque de 
Pode III, 28 et celle de l'ode I, 36, en particulier au début de l’ode, qui comprend des 
éléments du banquet immédiatement reconnaissables. Le poéme peut également étre 
rapproché, pour ses tournures et ses thématiques, d'autres odes symposiaques. 


Toutefois, le cadre symposiaque mis en place dans les deux premiers distiques s'estompe 
dans la suite du poème. En effet, la fête décrite n'a pas de dimension collective et, 
contrairement à ce que semble exiger la tradition des Neptunalia, elle ne prend pas 
place à l'extérieur. Au contraire, l'espace de l'action relève de l’intime, puisque les 
deux personnages sont vraisemblablement chez Lydé ou chez le poéte lui-méme, et 
un jeu de complémentarité et de paralléle se noue entre les deux personnages. Cette 
complémentarité est soulignée par les constructions rythmiques et syntaxiques dés le 
deuxiéme vers. À l'évocation de la féte succéde l'introduction de la deuxiéme personne 
avec les impératifs prome et adhibe. Le lien créé entre le poéte et son interlocutrice est 
souligné par la présence de la première et de la deuxième personne de part et d'autre de la 
césure avec faciam/prome. Cet effet est appuyé par l'apparition du nom Lyde en début de 
vers suivant qui succède à l'apparition du poète au vers 2. Enfin, l'élision de munitaeque 
donne au début du quatriéme vers la méme valeur métrique que Neptuni faciam au début 
du deuxième vers (deux fois trois syllabes), créant une structure parallèle entre les deux 
premiers asclépiades mineurs en méme temps qu'entre Lydé et le poète : dans le premier 
asclépiade mineur le poète intervient pour la première fois en parlant de lui-même, dans 
le second il s'adresse à Lydé sur le mode injonctif. 

Les deux distiques suivants présentent une unité syntaxique et mettent en place des 
effets similaires à ceux des deux premiers distiques : 


11. Nisbet & Rudd (2004 : 340). 
12. Davis (2016 : 275-285). 
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———U u—u— 
Inclinare meridiem 
——— uu -Íl UYU U 
sentis, ac ueluti stet uolucris dies, 
—— —uUu —u— 
parcis deriper(e) horreo 
——— uu -JÍl UYU U 
cessantem Bibuli consulis amphoram ? 


Le premier distique était construit sous forme de question du narrateur à lui-même avec 
un subjonctif de délibération (faciam) tandis que le troisième et le quatrième distiques sont 
constitués d'une question à Lydé. Un autre parallélisme est produit par la répétition avec 
polyptote et figure étymologique du mot dies en fin de vers : die est employé au vers 1 
pour désigner le jour en tant que date de féte, il réapparait au vers 5 et au vers 6 avec 
meridiem, «le midi », dans le glyconique, et dies dans l'asclépiade mineur qui renvoient 
plutót au jour comme unité temporelle : le jour qui passe conduit au rapprochement du 
poéte et de Lydé. On a donc un glissement sémantique de l'évocation de la dimension 
collective de la féte à la mention du jour comme unité de mesure temporelle qui encadre 
le rapprochement entre les deux protagonistes. 


Enfin, ces distiques présentent une variation rythmique, en mettant en présence le 
rythme le plus régulier de l'asclépiade mineur avec un rythme secondaire. En effet, 
l'asclépiade mineur a pour caractéristique de posséder une concordance entre l'ictus 
métrique et l'accent de langue dans son deuxième hémistiche à l'exception de la dernière 
syllabe et une absence de concordance entre l'ictus métrique et l'accent de langue dans 
le premier hémistiche dans la majorité des cas ?. La position de l’ictus métrique dans le 
vers peut être représentée de la manière suivante : 


i Qi Log / / 
— — af u u — u — 1/3/6/1/10/12 (ou 2/3/6/7/10/12) 
I 9$ 3456 7 & 9101 12 


Le vers 8 est constitué de quatre mots de trois syllabes permettant l'accentuation suivante '* : 
cessantem Bibuli // cónsulis ámphoram ? 2/4/7/10 (Hor., O. III, 28, 8) 

Cet asclépiade mineur présente un rythme trés classique et régulier : il posséde le rythme 

accentuel le plus courant dans ce type de vers et il est assorti de la construction la plus 

classique de l'asclépiade mineur, soit un vers trés régulier constitué de quatre mots de trois 

syllabes répartis symétriquement de part et d'autre de la coupe. Avec 45 occurrences dans 


l'ensemble des Odes, c'est l'arrangement le plus répandu de l'asclépiade mineur et c'est 
également celui qui ouvre le recueil P. On le retrouve dans le premier vers de l'ode I, 1 '°: 


Maecénas átauis // édite régibus 2/4/7/10 (Hor., O. I, 1, 1) 
Le distique précédent met en place un rythme secondaire dans l'asclépiade mineur : 
séntis, ac uéluti // stét udlucris dies — 1/4/7/8/11  (Hor., O. IM, 28, 6) 


13. Becker (2016 : 295) compte entre 239 et 254 vers possédant le rythme accentuel majoritaire sur 
509 vers, soit environ 50 % des asclépiades mineurs. 


14. Dans cet exemple et dans les deux exemples suivants la place de l'accent de langue est signalée par 
un accent et les syllabes sur lesquelles tombe l'ictus métrique sont soulignées. 
15. Richardson (1901 : 286). 


16. Becker (2016 : 299) souligne le róle fondamental que jouent les premiers vers écrits dans un métre 
particulier dans la mesure oü ils forgent un horizon d'attente sonore pour le lecteur ou l'auditeur. 
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Sile rythme accentuel 1/4/7/10 ou 2/4/7/10 est celui qui se rencontre le plus fréquemment, 
l'asclépiade mineur admet des variations du rythme accentuel dans le premier et dans 
le deuxiéme hémistiche. On observe que le premier hémistiche du vers 6 présente, sauf 
sur la première syllabe, une absence de concordance entre l’ictus métrique et l'accent de 
langue qui est régulière, alors que le deuxième hémistiche comporte trois accents et met 
en place un rythme accentuel que l'on peut qualifier de secondaire. En effet, en plus de la 
7° syllabe, la présence d'un mot dissyllabique en fin de vers précédé d'un mot trisyllabique 
permet d'accentuer les 8* et 11* syllabes au lieu de la 10* syllabe. 

L'alternance rythmique entre ces deux vers est la premiére alternance de ce type que 
l'on trouve dans l'ode. Elle est ensuite amenée à se répéter. 


Cette ode constitue une synthése des différents aspects de la poésie symposiaque en 
mélant l'évocation du symposion et des activités qui lui sont associées, par exemple le 
chant, à une dimension érotique et à une dimension philosophique présentes dans d'autres 
odes d'inspiration symposiaque comme l'ode I, 36 ou l'ode I, 27 inspirée d'Anacréon. 
Mais il faut noter d'emblée que les éléments symposiaques mis en place sont intégrés dans 
une esthétique de la complémentarité entre les deux personnages qui semble spécifique 
à l'ode III, 28. En effet, la plupart des odes symposiaques sont adressées à des amis ou 
font allusion au contexte politique '’. Parmi les odes que l'on pourrait qualifier d'érotico- 
symposiaques dans les trois premiers livres, aucune ne met en scéne un rapprochement 
entre deux protagonistes en valorisant leur complémentarité. Bien souvent, la scéne de 
banquet implique une multitude de personnages et la dimension érotique est exprimée 
par des chansons sur l'amour (comme à la fin l'ode III, 19, qui est sans doute du point 
de vue du mètre et du sujet l’ode symposiaque la plus proche de l'ode III, 28) ou par 
le biais des discussions ayant lieu pendant le banquet (I, 27). La mise en place d'une 
esthétique de la complémentarité liée à un sujet érotico-symposiaque semble donc étre 
un trait propre à l’ode III, 28. 


3. L'INTÉGRATION DU GENRE DE L'HYMNE 


Dans la suite de l'ode, la dynamique de complémentarité se poursuit dans un jeu d'entre- 
croisement des voix du poète et de Lydé à travers la récitation alternée d'hymnes : 


Uu U 
Nos cantabimus | inuicem 
Uu -—//—wuw U 
Neptun(um) et uirides ^ Nereidum | comas 
UU— U 
tu curua recines lyra 
Uu—//—wuwu-—-u 
Laton(am) et celeris spicula Cynthiae. 


17. Sil'on adopte la classification de Villeneuve (1967), sur les 12 «odes bachiques» des trois premiers 
livres, cinq sont adressées à un ami ou un proche d'Horace (dans le livre I, les odes 18, 36 et 
éventuellement 9 et, dans le livre III, les odes 8 et 17), une est liée au contexte politique (III, 14, mais 
on pourrait aussi citer lode I, 37, que Villeneuve ne classe pas comme une ode bachique, mais qui 
commence par une invitation à boire et à fêter la mort de Cléopâtre). L’ode III, 21 représente un cas 
à part : elle est adressée à une amphore. Enfin, les odes I, 27 et III, 19 présentent pour Villeneuve une 
situation similaire. Dans l'ode I, 27, Horace intervient lors d'un banquet pour régler une querelle sur 
l'amour et, dans l'ode III, 19, il interrompt un pédant lors d'un banquet avant de terminer par une 
«chanson bachique ». D'autres odes (lode I, 11 ou l’ode III, 29 par exemple) présentent, de manière 
plus discrète, des motifs symposiaques qui ne sont pas le point de départ du poème. 
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Ce passage permet une inclusion du genre de l'hymne dans le corps du poéme en repro- 
duisant un style associé a plusieurs modeles : d'abord celui des hymnes homériques puis 
celui des hymnes sapphiques. 

L'hymne est souvent associé au genre symposiaque, sa présence fait donc partie du 
déroulement normal de la célébration. Le genre de l'hymne se retrouve dans plusieurs 
odes, mais sa représentation dans les odes en asclépiade mineur est minime '*. On le 
trouve surtout dans le cadre de la strophe sapphique ou de la strophe alcaique, avec une 
répartition à peu pres égale. 

On peut voir dans la construction des distiques une reproduction du style de l'hymne. 
Dans les glyconiques, l'annonce du chant avec cantabimus puis avec recines soulignée 
par l'usage des pronoms personnels met en place une esthétique similaire à celle des 
hymnes homériques. Ainsi, Françoise Létoublon "° souligne l'importance des « formules 
d'ouverture» dans les hymnes : l'expression employée le plus couramment pour ouvrir un 
hymne, üpyou’ àcíógtv, peut aussi être employée au futur sans la mention du commencement, 
soit copo employé seul. Dans les vers en asclépiade mineur, la construction grammaticale 
fait aussi écho au style de l'hymne. En effet, Francoise Létoublon indique également 
que, contrairement à la prière, l'hymne se caractérise par une évocation des dieux sans 
adresse directe, donc souvent à l'accusatif ou au génitif plutót qu'au vocatif, et que cette 
évocation s'accompagne en principe d'une description de leurs attributs traditionnels. On 
retrouve dans ces vers tous ces éléments : les noms de Neptune et de Latone sont utilisés 
à l'accusatif et en relation avec des éléments qui leur sont liés. Le nom de Diane, quant 
à lui, n'est pas clairement mentionné mais la déesse est désignée par le génitif Cynthiae, 
au vers 12, qui renvoie à sa naissance sur le Cynthe à Délos. 

Le retour de cette même répartition des données entre le glyconique et l’asclépiade 
souligne le parallélisme entre les deux voix qui se répondent. Les deux distiques sont construits 
de la méme manière : dans le glyconique le chant est annoncé et ses sujets sont résumés 
dans l'asclépiade. Les deux glyconiques contiennent les mêmes éléments. On y trouve le 
pronom personnel nos au vers 9, tu au vers 11. Ces pronoms sont mis en valeur en début 
de vers et par le fait qu'ils sont tous les deux accentués. Au verbe cantabimus du vers 9 fait 
écho le verbe recines au vers 11, complémentarité soulignée par l'emploi de inuicem dans 
le sens de «à mon tour». De même, la construction des deux asclépiades est très similaire 
avec la présence d'un nom propre complément d'objet, d'une conjonction copulative, d'un 
adjectif épithète, d’un deuxième complément d'objet et d'un complément du nom, avec une 
variation d'un vers à l'autre : l'inversion des positions du deuxiéme complément d'objet et 
de son complément du nom. De cette facon, l'hymne est intégré dans le jeu soulignant la 
complémentarité entre le poéte et Lydé qui est perceptible dés les premiers vers. 

Toutefois, cette complémentarité ne se manifeste pas de la méme maniére que dans 
les premiers distiques. On passe en effet d'une construction soulignant l'union des deux 
personnages avec un débordement d'un distique sur l'autre à deux distiques séparés qui 
correspondent chacun à la voix d'un personnage. On peut considérer que cette séparation 
des voix reléve du jeu et ne traduit pas une véritable opposition entre les personnages mais 
propose une manière différente de les mettre en rapport avant la réunion dans les deux 
derniers distiques. Ainsi, l'intégration du genre de l'hymne participe de la mise en scene 


18. Un seul poéme en asclépiade mineur peut étre entiérement rattaché au genre de l'hymne. Il s'agit 
de l'ode I, 21, qui se présente davantage comme une invitation à chanter un hymne que comme un 
hymne méme. Par comparaison, dans le livre I, Llewelyn Morgan (2010 : 16) identifie un groupe 
d'hymnes en strophes sapphiques qui ont des caractéristiques similaires et sont liés au modéle du 
kletikos hymnos de Sappho : les odes 2, 10, 30 et 32 du livre I. Dans le livre II, il identifie les odes 
IIL, 11 et M, 18. 


19. Létoublon (2013 : 21-35). 
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du rapprochement entre les deux protagonistes. Leurs voix se mélent momentanément 
puis se répondent avant de se réunir et leur union est symbolisée par la récitation d'une 
méme voix cette fois-ci d'un hymne en l'honneur de Vénus : 


UU U 
summo carmine, quae Cnidon 
U U—//—wwu U 


fulgentesque tenet Cycladas et Paphum 
—— —U U—U— 
iunctis uisit oloribus. 
uu -— // UU U 
Dicetur merita Nox quoque nenia. 


On note que les caractéristiques de Vénus sont plus longuement développées que celles 
de Neptune, dont la célébration marquait pourtant le point de départ de I’ ode, ou que celles 
de Latone. Leur évocation rappelle par ailleurs l'ode I, 30, en strophes sapphiques, adressée 
à Vénus : 

O Venus regina Cnidi Paphique, 
sperne dilectam Cypron et uocantis (Hor., O, I, 30, 1-2) 


Le nom de Vénus n'est pas clairement mentionné mais elle est reconnaissable gráce à ses 
attributs traditionnels, déjà évoqués dans cette autre ode, qui est un exemple d'hymne, 
écrite dans le style de Sappho”. La similarité entre ces deux textes signale aussi ce 
passage comme une imitation de l'hymne. 


4. LE RYTHME DE LA NENIA 


Alors que la derniére partie de la récitation est consacrée à Vénus et s'achéve sur une nénie 
dédiée à la Nuit personnifiée, le passage de la forme de l'hymne à celle de la nénie est 
aussi celui d'un genre bien identifiable et associé à la scéne de banquet et à la célébration 
publique à un genre lié originellement aux rites funébres. Les divinités évoquées changent 
également, à mesure que s'opére le rapprochement entre les deux personnages : de la 
mention de la fête de Neptune à celle de la Nuit, le poème semble glisser du cadre festif 
et collectif au cadre nocturne et intime en méme temps que s’opére le glissement d'un 
rythme approprié au banquet vers un autre rythme, celui de la nénie, dont l'importance 
apparait dans sa mise en valeur comme dernier mot du poème. Ainsi, le premier mot du 
poème, festo, s'oppose à la mention finale de la nénie, qui paraît déplacée dans un contexte 
de fête. Mais une analyse plus attentive du mouvement du poème et du sens à donner au 
mot nenia peut conduire à reconsidérer l'ensemble de l’ode, qui semble marquée par une 
forte ambiguité générique et dont les rythmes et les thématiques peuvent faire écho dés les 
premiers vers au rythme de la nénie qui clót le poéme. Le terme nenia recouvre plusieurs 
réalités, y compris chez Horace, qui l'emploie dans des contextes trés différents. Il parait 
donc nécessaire de tenter de déterminer à quels traits stylistiques et thématiques Horace 
fait référence à la fin de son poème et comment ces traits s’intègrent dans l'ensemble du 
poème et se situent par rapport aux autres genres littéraires qui y sont convoqués. 

Nous savons peu de choses des caractéristiques de la nénie comme genre littéraire. 
Le terme désigne d'abord un chant produit au cours des défilés funéraires par des femmes, 
les praeficae, accompagnées de musiciens jouant de la flüte et de divers instruments à cordes. 
Le terme devient ensuite polysémique et désigne plusieurs types de productions littéraires 


20. Morgan (2010 : 16) cite cet hymne comme un représentant du genre du kletikos hymnos, dont le 
modèle semble être Sappho (en particulier avec l'hymne à Aphrodite). 
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allant du chant funèbre à la comptine. On observe cette polysémie dans l'oeuvre d' Horace 
elle-méme, qui présente plusieurs acceptions de ce terme. On trouve une occurrence de 
nenia dans le sens de « formule» ou «incantation magique» dans les Epodes?! alors 
que, dans le livre II des Odes, la nénie est trés clairement prise dans son sens de «chant 
funèbre » 22. Enfin, on trouve dans les Építres une mention de la nénie qui semble renvoyer 
au sens de «comptine »?. 

Pour Dorota Dutsch, la polysémie du mot nenia peut s' expliquer par des traits communs 
à tous les types de production évoqués chez Horace *. Selon elle, la caractéristique qui 
lie toutes ces nénies est la répétitivité, qui est perceptible à plusieurs niveaux : dans les 
sons, dans les rythmes et dans les structures grammaticales, qui créent une «esthétique 
de la répétitivité » ?. Nous examinerons d'abord la manière dont cette répétitivité est mise 
en œuvre dans les autres poèmes faisant référence à ce genre. 


Dans le livre II des Odes, les deux poémes qui contiennent une occurrence du mot nenia 
semblent se répondre. Cet effet est d'autant plus visible que ces odes encadrent le livre II. 
On peut ainsi mettre en regard les vers 37-40 de l’ode II, 1 et les vers 21-24 de l’ode II, 20: 


Sed ne relictis, Musae procax, iocis 
Ceae retractes munera Neniae 
mecum Dionaeo sub antro 
quaere modos leuiore plectro. 
«Mais tu ne dois point, Muse, sans retenue, laisser là tes jeux et entreprendre sur les 
attributs de la nénie de Céos ; viens avec moi chercher, au fond de la grotte dionéenne, des 
rythmes frappés d'un plectre moins grave.» (trad. F. Villeneuve, C.U.F.) 


Absint inani funere neniae 
luctusque turpes et querimoniae ; 
conpesce clamorem ac sepulcri 
mitte superuacuos honores. 
«Que, de mon convoi funébre, on écarte les nénies, la laideur des gémissements et des 
lamentations; fais taire les cris et laisse là les honneurs superflus du sépulcre.» (trad. 
F. Villeneuve, C.U.F.) 


Il est remarquable que, dans les deux poèmes, la nénie soit mentionnée dans la dernière 
strophe, de manière péjorative et pour rejeter une esthétique qui ne siérait pas à la pratique 
poétique d' Horace. En réalité, c'est la nénie funébre qui est décriée en fonction de critéres 
thématiques et esthétiques. Dans le premier cas, le terme de «nénie» désigne le thrène 
pratiqué par Simonide de Céos. La référence s'insére dans ce que Dominique Voisin 
qualifie de «recusatio tardive». En effet, tout le poème est construit en forme d'éloge 
(sans doute teinté d'ironie) de Pollion, qui aurait écrit des Historiae dans un style qui 
mêle au récit historique l'emphase et le pathétique de la tragédie”. La dernière strophe 
du poème a une valeur programmatique et oppose le projet poétique d' Horace dans les 
Odes à celui de Pollion. Cette opposition se traduit par le choix de sujets légers et d'un 
style qui se refuse aux lourdeurs et à la gravité. La nénie semble étre associée au style 
que refuse Horace. Pour Dominique Voisin, les deux strophes précédentes sont déjà une 


21. Hor., Ep. XVII, 29. 

22. O.I, 1, 38 et O. II, 20, 21, voir infra. 

23. Hor. Ep. I, 1, 63. 

24. Dutsch (2007 : 272). Sur les caractéristiques de la nénie, voir également Habinek (2005 : 221-253). 
25. Ibid. 

26. Voisin (2001 : 45). 

27. Nisbet & Hubbard (1978 : 9). 
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imitation du style de la nénie?*, marqué par des effets d'accumulation, des échos sonores 
et des anaphores par exemple. 

Toutefois, on peut penser que ce n'est pas l'esthétique de la répétitivité associée à 
la nénie qui est rejetée en elle-méme, mais plutót son usage quand elle vient exagérer 
le pathétique de certains sujets. C'est précisément parce que la nénie évoquée dans ces 
poemes est explicitement liée à la lamentation funébre et donc à des sujets graves et 
sérieux que son rythme parait pesant. En effet, si les deux strophes précédant l'évocation 
de la nénie dans l'ode II, 1 sont effectivement l'occasion d'un pastiche stylistique, il est 
remarquable que les effets employés à cet endroit se retrouvent dans plusieurs autres 
poèmes en asclépiade mineur sans qu'ils fassent l'objet d'une mise à distance. Enfin, il 
faut noter que, dans les Építres, Horace cite une nénie qui est un fragment de comptine 
pour enfants dont nous connaissons la deuxiéme partie par Porphyre : 


Rex erit qui recte faciet, qui non faciet, non erit. — (Porph., ad Ep. I, 1, 626) 
«Il sera roi s’il agit bien, sinon il ne le sera pas.» 


Cette nénie est un exemple frappant de mise en ceuvre de la répétitivité sur le plan 
syntaxique et lexical aussi bien que sonore. Mais, ici, la répétitivité ne fait pas l'objet 
d'une condamnation stylistique, au contraire, le vers cité par Horace est introduit par le 
participe ludentes qui décrit l’activité des enfants et contribue plutôt à inscrire la nénie 
dans un contexte léger. Dans ce cas, la répétitivité n'est pas du tout perçue de la méme 
manière que dans les deux passages du livre II des Odes : elle contribue plutôt à caracté- 
riser la comptine pour enfants tout en suggérant une forme de sagesse populaire (la nénie 
est utilisée pour justifier le développement d'une réflexion sur le pouvoir) transmise par 
la répétition d'une époque à l'autre. 

L'autre point commun entre les nénies serait leur róle, en lien avec une transition à 
effectuer, que ce soit de la vie à la mort ou de l'enfance à l'áge adulte. Dans le cadre de 
l'ode III, 28, on peut supposer que l'évocation de la nénie n'a pas simplement pour but 
de créer un contraste avec le cadre symposiaque dans lequel elle apparait, mais plutót 
de brouiller la distinction entre ces deux genres en opérant un passage de l'un à l'autre. 
Le passage est effectivement constitué par la reproduction d'un rythme que l'on peut 
associer à la nénie, de manière évidente à la fin du poème et, de façon plus discrète, dans 
l'ensemble de l'ode. 


Ainsi, dans le dernier vers du poème, tout évoque le style de la nénie. Le rythme 
accentuel le plus régulier, 2/4/7/10, est parfaitement respecté avec la présence de deux mots 
de trois syllabes avant la césure auxquels répond un groupe composé d'un monosyllabe 
(Nox) et de l'enclitique dissyllabique quoque, et un mot trisyllabique avec nenia. Ainsi, 
la régularité rythmique de la premiére partie du vers est conservée dans la seconde : 


dicétur mérita Nóx quoque nénia 2/4/7/8/10 (Hor., O. III, 28, 16) 


On note aussi un jeu de correspondances reposant sur les sonorités : merita placé à la césure 
fait écho à nenia en fin de vers. L’impression de sonorités languissantes et répétitives est 
soulignée par l'allitération des nasales [n] et [m] dans merita, Nox et nenia. Ainsi, ce vers 
présente une grande régularité sonore qui semble reproduire le rythme associé à la nénie. 

On peut considérer que ce rythme, fondé sur la répétition sonore et la régularité, est 
annoncé dès les premiers distiques. On peut remarquer d'abord la régularité structurelle 
de vers dont le rythme est secondaire : 


séntis ac, uéluti // stét uólucris dies 1/4/7/8/11 (Hor., O. III, 28, 6) 


28. Voisin (2001 : 44-45). 
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Ici, l'accent est déplacé par rapport à l'ictus en fin de vers. On remarque cependant 
une symétrie entre les deux parties du vers : on trouve aprés comme avant la césure un 
monosyllabe suivi d'un mot de trois syllabes (ac ueluti, stet uolucris). L'effet est renforcé 
par l'allitération et la similarité globale des sonorités de ueluti et uolucris. Ainsi, on peut 
sentir la présence d'un rythme régulier qui donnerait l'impression d'une répétitivité. 

On peut aussi observer la mise en regard de la nénie en fin de poème et des autres genres 
littéraires convoqués au fil de l'ode. Les premiers vers sont consacrés à l'évocation d'un 
jour de féte qui pourrait donner lieu à une poésie officielle mais on note une progression 
du jour à la nuit, du public au privé et du chant officiel constitué par l'hymne à la nénie. 
Cette derniére semble s'opposer aux autres genres poétiques convoqués par sa dimension 
populaire : le mot nenia peut désigner la berceuse ou la comptine pour enfants, dont les 
ambitions et la construction sont trés éloignées de l'hymne ou de la poésie publique. 
L'étude rythmique de l'ensemble du poéme permet de penser que le rythme propre à la 
nénie est peut-étre le rythme principal de l'ensemble de l'ode. 

La sonorité répétitive de la nénie peut étre évoquée par le rythme de la deuxiéme partie 
de l’ode qui repose sur une alternance. Les cinquième et sixième distiques présentent un 
jeu d'inversion sur le rythme accentuel de l'asclépiade mineur et du glyconique : 


Nós cantábimus inuicem 1/3/6 
Neptunum et uirides Neréidum cómas  2/4/8/11 (Hor., O. III, 28, 9-10) 


Dans ce cinquième distique, le glyconique présente le schéma accentuel 1/3/6, ce qui 
est un rythme secondaire, créé par la présence d'un mot de trois syllabes en fin de vers. 
Dans l'asclépiade mineur, où le schéma accentuel le plus courant est 2/4/7/10 avec un 
mot de trois syllabes en fin de vers, on trouve un placement des accents en 2/4/8/11 avec 
un mot de deux syllabes en fin de vers. Cette disposition est secondaire et se trouve dans 
35 % des cas contre pratiquement 50 % pour le mot de trois syllabes en fin de vers. On 
peut donc observer un jeu entre le rythme attendu du glyconique et celui de l'asclépiade 
mineur : la configuration du vers la plus attendue dans l'asclépiade mineur est reportée sur 
le glyconique. Ce phénomène est d'autant plus marquant que le glyconique et l’asclé- 
piade mineur partagent une structure trés similaire ainsi qu'une proximité de leur rythme 
accentuel : si, contrairement à ce qui se produit dans l’asclépiade mineur, le type de mot 
le plus courant en fin de glyconique est le dissyllabe, cette configuration permet de mettre 
en place dans le glyconique un rythme accentuel en 1/4/7 qui peut faire penser au rythme 
accentuel d’un asclépiade mineur tronqué aux trois quarts. 

Le distique suivant présente au contraire un retour à une répartition accentuelle 
classique : 


tu curua récines lyra 1/2/4/7 
Latonam et céleris spicula Cynthiae 2/4/7/10 (Hor., O. III, 28, 11-12) 


On trouve dans le glyconique le schéma accentuel 1/2/4/7 et dans l'asclépiade mineur la 
disposition 1/4/7/10, ce qui correspond aux deux rythmes accentuels les plus courants 
du glyconique et de l'asclépiade mineur. Ainsi, au fil des deux distiques, un asclépiade 
et un glyconique au rythme secondaire laissent place à un asclépiade et un glyconique 
au rythme majoritaire. 

On trouve dans les deux derniers distiques une disposition un peu différente mais 
obéissant à des principes similaires : 


summo cármine, quáe Cnidon 1/3/6 
fülgentésque ténet Cycladas et Páphum  1/3/5/7/11 
iunctis uisit olóribus ; 1/3/6 


dicétur mérita Nox quoque nénia. 2/4/7/10 (Hor., O. III, 28, 13-16) 
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Le premier glyconique a le rythme majoritaire et le second le rythme secondaire, tandis que 
le premier asclépiade mineur a le rythme secondaire et le deuxiéme le rythme le plus courant. 
Les deux asclépiades mineurs font l'objet d'une alternance rythmique en tous points similaire 
à celle du groupe précédent tandis que l'ordre d'alternance des glyconiques est inversé. 
Dans les deux derniers couples de distiques, on retrouve une structure où un rythme 
secondaire répond à un rythme principal, créant un effet d'alternance rythmique pour s'achever 
sur un asclépiade mineur au rythme régulier. Cette alternance entre rythme majoritaire et 
secondaire est aussi visible entre les deux asclépiades mineurs des troisiéme et quatriéme 
distiques : le vers 6 présente le rythme secondaire et le vers 8 le rythme majoritaire : 


séntis ac, uéluti stét udlucris dies 1/4/7/8/11 (Hor., O. III, 28, 6) 
cessántem Bibuli cónsulis ámphoram? | 2/A/7/10 (Hor., O. HI, 28, 8) 


Ces variations rythmiques créent une alternance régulière et instaurent une deuxième 
temporalité, cyclique, dans l’ode. La construction de l’ode est bien définie en quatre 
couples de distiques qui, groupés deux à deux, constituent deux grands mouvements : le 
premier au présent, l’autre au futur avec l’aboutissement de la relation entre Lydé et le 
poète. Il y a ainsi une progression temporelle linéaire qui coexiste dans le poème avec la 
temporalité cyclique induite par les effets de répétition. 

Il est difficile de déterminer à quel point l’alternance rythmique mise en place dans 
Vode était perceptible. Toutefois, n'ayant remarqué aucun autre effet d'alternance de cette 
ampleur dans le reste des odes en asclépiade mineur, nous sommes tentée de croire que 
le poème possédait un rythme particulier propre au genre de la nénie. Cette interprétation 
est par ailleurs confortée par d’autres observations. 

Ainsi, on note d’autres effets d’écho et de répétition qui évoquent le rythme de la nénie. 
Le premier et le deuxième temps du poème se répondent par la répétition du nom de Neptune, 
produisant une impression de répétition avec variation, à la fois thématique et sonore : 


Neptuni faciam ? Prome reconditum (Hor., O. III, 28, 2) 
Neptunum et uirides Nereidum comas (Hor., O. IMI, 28, 9) 


On peut aussi noter le parallèle entre les mots sapientiae et Cynthiae, deux mots qui 
se terminent par les mémes sonorités, respectivement à la fin de l'asclépiade mineur du 
premier distique du poème et de l'asclépiade mineur du distique qui ouvre le deuxième 
temps du poéme : 


munitaeque adhibe uim sapientiae (Hor., O. III, 28, 4) 
Latonam et celeris spicula Cynthiae (Hor., O. III, 28, 11) 


Par ailleurs, à l'effacement progressif des circonstances de composition du poéme 
(la féte des Neptunalia) répond un effacement quasi total du lieu et du temps dans lesquels 
se déroule le poéme : le premier Neptune évoqué au vers 1 est bien la divinité latine 
liée aux eaux vives et aux sources mais le deuxiéme Neptune, associé aux Néréides, est 
plutôt assimilé à Poséidon?". Le déplacement vers la référence grecque est assorti de 
tout un réseau d'hellénismes, à commencer par le nom de Lydé, d'inspiration grecque, 
le mot /yra au vers 11, Cnidon au vers 13 et l'accusatif pluriel grec Cycladas au vers 14. 
Certaines versions donnent aussi Paphon * au lieu de Paphum au vers 14. La mise en 
place de cet environnement grec est mélée à l'évocation d'un consul romain, Bibulus, 
au vers 8 et d'un vin du Latium, le Cécube, au vers 3 dans le cadre d'une féte latine. 
L'absence de lieu défini et le mélange des références grecques et latines contribue à la 


29. Davis (2016 : 278). 


30. Nisbet & Rudd (2004 : 343) : «after Cnidon the Greek form Paphon is preferable to the even better 
attested Paphum ». 
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mise en place d'un lieu purement poétique, comme l’a souligné Gregson Davis?!'. Ce 
lieu n'est pas véritablement lié à une tradition romaine, il est plutót un espace indéfini 
ou se rencontrent plusieurs traditions littéraires, ce qui encourage la lecture de cette ode 
comme un déplacement des topoi de la poésie symposiaque de leur utilisation dans le 
cadre d'une poésie de circonstance vers leur mise en fonctionnement dans une poésie 
répétitive où repères temporels et spatiaux sont abolis. 

Un autre trait soutenant cette interprétation est la briéveté du poéme, qui comporte 
seulement 16 vers, par contraste avec l'ode symposiaque III, 29 qui en comporte 64. Cette 
brièveté peut être liée à la représentation d'une pièce légère ou de moindre importance. 
À l'inverse, lode III, 29, adressée à Mécène, s'ouvre sur une invitation à boire mais se 
poursuit sur un mode plus sérieux avec une série d'injonctions reliées à une réflexion 
philosophique. La nénie est peut-étre donc non seulement mise en valeur à la fin du 
poème, mais aussi perceptible dans tout le déroulement de l’ode par la mise en place 
d'un rythme et d'une esthétique que l’on pourrait associer à la nénie dans un sens qui ne 
serait ni celui de la nénie funébre ni véritablement celui d'une comptine. 


5. CONCLUSION 


L'ode III, 28 rassemble de nombreux éléments traditionnels de la poésie symposiaque. 
Cet aspect est d'autant plus important qu'elle s'inscrit dans un réseau d'odes sympo- 
siaques qui font appel aux mémes motifs et parfois au méme vocabulaire et qu'elle est 
placée de maniére symétrique par rapport à une ode symposiaque modele (l'ode I, 36). 
La présence de la récitation alternée d'hymnes est l'occasion de l'inclusion d'un autre 
genre littéraire, tout en conservant l'esthétique de la complémentarité développée dans 
le premier mouvement du poéme. Le cadre générique, qui semblait bien défini au début 
de l'ode, fait l'objet d’un effacement à mesure que le poème développe le rapprochement 
entre les deux personnages. En effet, on observe le déplacement d'un environnement 
propice à la production d'une poésie de circonstance, associée à la féte des Neptunalia, 
vers un cadre plus obscur marqué par la mention de la Nuit et de la nénie. L'évocation 
finale de la nénie permet d'enrichir les références génériques de l'ode en l'inscrivant dans 
plusieurs traditions littéraires et en complexifiant son identité générique. 

La nénie, chant funébre à l'origine, semble toujours étre liée à un rythme simple et 
répétitif accompagnant l'idée d'un passage ou d'une transition d'un état ancien vers un 
état nouveau. Cette transition est peut-étre représentée dans le poéme par le passage du 
cadre originel à une tout autre dimension. Ces deux dimensions ne sont pas séparées dans 
le poéme. La forme particuliére de l'asclépiade mineur associé au glyconique, auquel il 
est trés semblable d'un point de vue structurel et rythmique, permet d'intégrer toutes ces 
influences littéraires : le vers peut aussi bien mettre en relief des éléments cruciaux pour la 
reconnaissance de l'appartenance de l’ode à un réseau symposiaque bien défini (avec la mise 
en valeur de sapientiae, par exemple, qui fait écho à l'ode I, 11) que permettre successivement 
l'imitation du style de l'hymne dans les vers 9-12 et celui de la nénie au vers 16. 

La forme du distique permet également de jouer sur les particularités du rythme accentuel 
des deux métres qui le composent pour mettre en place un deuxiéme niveau d'ambiguité 
générique. Ainsi, on observe dans la deuxiéme partie du poéme une alternance réguliére 
dans les vers en asclépiade mineur entre les vers qui possèdent le rythme le plus couramment 
associé au vers, qui correspond aux attentes de l'auditeur, et ceux qui possèdent un rythme 
que l'on trouve moins souvent et qui peut étre percu comme secondaire au sens ou il est 
moins attendu par l'auditeur. De plus, ce rythme secondaire prend place dans des vers qui 


31. Davis (2016 : 276). 
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ont souvent une moindre régularité structurelle, là où le rythme que l'on pourrait qualifier 
de majoritaire est associé à la forme la plus réguliére du vers (4 mots de 4 syllabes, faisant 
ressortir la grande régularité structurelle de l'asclépiade mineur). Cette alternance provoque 
une forme de régularité rythmique qui, associée à d'autres effets de répétition, peut faire 
penser à la mise en œuvre de l’esthétique de la répétitivité caractérisant toutes les formes de 
nénie. Ainsi, la présence d'un rythme fondé sur la régularité et la répétition traversant tout 
le poème laisse penser que, dés les premiers vers, un glissement générique est à l’œuvre 
de la poésie symposiaque, accompagnée par l' inclusion du genre de l'hymne, vers la 
nénie, glissement que la mention de ce genre littéraire à la toute fin du poéme vient rendre 
perceptible en invitant à la relecture de l'ensemble du poéme en ce sens. 

L'identité générique de l'ode III, 28 est déterminée par deux modes d'intégration 
générique différents. Harrison fait apparaitre dans la poésie latine, et plus particuliérement 
dans les Odes d' Horace, un système d'intégration générique fondé sur la distinction entre 
un genre majoritaire (appelé «host genre» par Harrison) et un genre subordonné («guest 
genre»)*. Le genre de l'hymne fait l'objet d'une inclusion générique : elle est ponctuelle 
et clairement délimitée. Elle vient compléter l'identité générique de l'ode sans la changer 
fondamentalement. Le genre de l'hymne est subordonné dans ce poéme au genre symposiaque 
et ne modifie pas son identification comme «host genre». Au contraire, le genre de la nénie 
est plutôt associé à un phénomène de glissement générique : il est impossible de déterminer 
aussi nettement que pour l’hymne le moment où le genre apparaît. La nénie n’est pas un 
genre invité mais plutôt un second «host genre» qui s’impose progressivement à mesure 
que l’aspect symposiaque du poème s’estompe. Le premier mode d’intégration générique 
se caractérise par une imitation ponctuelle et très reconnaissable du style de l’hymne alors 
que le second s’appuie sur une imitation du style de la nénie, et plus particulièrement de 
son rythme, qui se substitue au rythme initial du poème. L’ode III, 28 a donc une identité 
générique complexe qui se construit à la fois par l’inclusion ponctuelle d’un genre subordonné 
et par le glissement d’un «host genre» vers un autre”. 
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L'AUTOMÉTATEXTUALISATION DE LA DIFFICULTÉ : 
ETUDE D'UN PROCEDE CRITIQUE 


Marie DE TOLEDO 


RÉSUMÉ 

Ce travail, d'inspiration métacritique, s 'inscrit dans le cadre d'une réflexion générale sur la rhétorique 
de la difficulté dans le commentaire. Il repose sur l'étude d'une opération critique en particulier, que 
Florian Pennanech appelle « autométatextualisation », et qui consiste à transformer le texte que l'on 
se donne pour objet en son propre commentaire. On s'intéresse ici plus particulièrement aux cas où les 
commentateurs établissent que le texte qu'ils étudient s 'autodésigne comme difficile, et l'on cherche 
à décrire le fonctionnement de ce procédé critique, à partir d'énoncés tirés des commentaires au 
prologue de l' Alexandra de Lycophron. Ce cas de figure, qui peut sembler trés précis et technique, 
permet en fait d'aborder un certain nombre de questions relatives à l'étude du discours critique. 


ABSTRACT 


This metacritical study if part of a more general reflection on the rhetoric of difficulty in the genre of 
commentary. It is based on the analysis of a specific critical operation that Florian Pennanech names 
"autometatextualisation" and which consists in transforming the text upon which one comments 
into its own commentary. We will more precisely take into account cases in which commentators 
state that the text that they study designates itself as difficult, and we will try to show how this 
critical device works, through examples of statements found in commentaries on the prologue to 
Lycophron 5 Alexandra. Such an object may seem excessively specific and technical, but actually 
offers the opportunity to approach a series of questions regarding the discourse of literary criticism. 


1. L'AUTOMÉTATEXTUALISATION DE LA DIFFICULTÉ : UN PROCÉDÉ SPÉCIFIQUE EN 
RÉPONSE À DES CONTRAINTES GÉNÉRIQUES 


Le commentaire de texte se présente d'abord, dans l'expérience commune, comme un 
exercice scolaire proposé aux étudiants de lettres dés l'enseignement secondaire. Celles et 
ceux qui s'y sont récemment adonnés, que ce soit en le pratiquant ou en le corrigeant, se 
souviennent sans doute de l'étape laborieuse que constitue la recherche et la formulation 
d'une problématique, censée structurer le propos et le sauver du péril de la paraphrase. 
D'autres se rappellent peut-étre encore quelques éclairs de génie, plus occasionnels il 
est vrai, où la mise en lumière de métaphores métapoétiques dans le texte commenté 
permet a minima de construire une astucieuse troisième partie, voire de bâtir l'ensemble 
du devoir à partir, par exemple, de l'élégante notion de métalittérarité. 

Ces remarques empiriques et apparemment triviales ne sont pas dénuées d'intérét dans 
le cadre d'un travail théorique sur le genre du commentaire de texte à travers les procédés 
rhétoriques qu'il met en œuvre. Parmi ces procédés, et derrière une appellation sans doute 
abstraite et technique, l'autométatextualisation de la difficulté renvoie en effet indirectement 
à ces éléments par ailleurs si familiers aux apprentis commentateurs comme à leurs maitres. 
Le néologisme «autométatextualisation » désigne, dans la poétique de la critique de Florian 
Pennanech, l'opération par laquelle «le texte est transformé [...] en un guide de lecture, de 
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sa propre lecture » : le repérage d'énoncés métapoétiques ou métatextuels dans un texte 
donné suffit en effet le plus souvent à en livrer une interprétation supposée valide, en vertu 
d'un principe d'autorité qui fait tout l'intérét du procédé. La notion de difficulté renvoie 
quant à elle à une caractéristique fondamentale du commentaire, qui se présente, méme 
dans sa forme la plus élémentaire, comme une médiation entre un hypothétique lecteur et 
le texte étudié : une telle médiation se justifie par l'établissement préalable, explicite ou 
non, d'une difficulté. L'autométatextualisation constitue un traitement possible de cette 
difficulté initiale dans le discours critique, et consiste, pour les commentateurs, à établir 
que le texte qu'ils se donnent pour objet s'autodésigne comme difficile. 

L'étude de ce cas de figure particulier permet d'aborder un certain nombre de questions 
qui s'inscrivent dans le champ de la métacritique. Ces questions peuvent d'abord sembler 
relever de l'épistémologie : établir que le commentaire se caractérise et, surtout, se justifie, 
entre autres, mais peut-étre avant tout dans un double rapport à l'autorité du texte et à sa 
difficulté revient à envisager la critique du point de vue de sa légitimité. Or, il ne s'agit 
en aucun cas de prétendre résoudre ce probléme fondateur, mais d'en étudier les effets 
possibles en discours. Le commentaire peut alors étre abordé en termes de rhétorique, 
et ce à plusieurs titres : d'une part, parce que, du point de vue de la perspective adoptée 
pour l’étudier, il s'agit de travailler à partir de catégories discursives générales que les 
énoncés critiques permettent d'exemplifier; d'autre part, parce que, en tant qu'objet, le 
discours critique peut ainsi étre considéré comme le lieu de l'élaboration de procédés 
argumentatifs visant à sa propre légitimation. 

Parmi ces procédés, l'autométatextualisation de la difficulté présente un intérét 
particulier, dans la mesure ot elle apparait comme une tentative de résolution du conflit 
entre un principe d'autorité et un principe de difficulté à l’œuvre dans la démarche critique. 
Il convient donc dans un premier temps de replacer cette opération spécifique dans une 
perspective plus générale et de proposer un certain nombre d' hypotheses de travail relatives 
à sa fonction dans une rhétorique du commentaire. Cette réflexion théorique laissera place, 
dans un second temps, à une analyse détaillée du fonctionnement de cette opération en 
discours, à partir d'énoncés tirés notamment des commentaires aux premiers vers de 
l'Alexandra de Lycophron. A travers cette étude de cas, il s’agira de relever quelques 
traits caractéristiques de l'écriture métatextuelle. 


2. UNE FONCTION RHÉTORIQUE : CONCILIER AUTORITÉ ET DIFFICULTÉ DANS LE 
COMMENTAIRE 


Avant d'étudier les différentes formes et les divers effets possibles de l'autométatextuali- 
sation de la difficulté dans le discours critique, il parait nécessaire d'expliciter un certain 
nombre d’hypothèses et de présupposés relatifs au genre du commentaire et à son étude. 


2.1. Un paradoxe épistémologique 


Ces hypothéses prennent leur source dans des questionnements épistémologiques, qu'il 
convient de mentionner non pas pour eux-mêmes, mais pour leur valeur heuristique. 
L'adoption provisoire d'un point de vue épistémologique permet en effet de mettre au 
jour les principes méthodologiques et idéologiques à l’œuvre dans le discours critique 
savant en général et dans le commentaire en particulier, afin non seulement de définir 
ces objets, mais également de justifier leur approche en termes de rhétorique. Avant de 


1. Pennanech (2019, à paraître). Cette opération est nommée et définie dans le premier chapitre de 
l'ouvrage. 
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chercher à comprendre comment fonctionne l'autométatextualisation de la difficulté, il 
convient donc de se demander ce qui peut justifier, pour le théoricien, de l'étudier et, 
pour le commentateur, de l'employer. 


2.1.1. La difficulté : un trait définitoire du discours critique savant 


Cette distinction entre théoricien et commentateur recoupe celle dont Michel Charles 
pose les fondements dans L'Arbre et la Source, où une culture rhétorique et une culture 
du commentaire sont opposées systématiquement, mais semblent dans un premier temps 
se rejoindre dans leur rapport fondamental à la difficulté. Ils constituent en effet les deux 
pendants d'un discours professionnel (ou «savant») qui s'oppose à une pratique non 
professionnelle (ou «mondaine ») non seulement parce qu'en aval, il se donne pour fin 
l'élaboration d'un savoir plutót que le partage d'une expérience, mais aussi parce qu'en 
amont, il fonde ce projet sur une difficulté posée comme inhérente à son objet : d'une 
manière générale, «le premier geste du professionnel est de montrer que tout n'est pas 
si simple*». Un principe de difficulté semble donc être à l’œuvre dans tout discours de 
savoir, et en particulier dans l'ensemble du discours savant sur la littérature, qu'il reléve 
du commentaire ou de la théorie littéraire. 

Or, si «les théoriciens et les commentateurs », qui produisent l'essentiel de ce discours 
savant, «évoluent dans le vaste domaine de la difficulté des textes ou des discours?», 
cette difficulté n'a précisément pas le méme statut en fonction de l'objet à laquelle elle est 
attribuée. Les théoriciens s'inscrivent en effet dans une tradition rhétorique, qui s'occupe 
de fonctionnements linguistiques généraux exemplifiés en discours ; ils postulent a priori 
que toute pratique langagiére, sans exception, est problématique. Les commentateurs, 
en revanche, s' intéressent à des textes en particulier : ils doivent à chaque fois établir le 
caractère unique et essentiel des difficultés propres à leur objet. 


2.1.2. L’autorité : un principe du commentaire de texte 


La rhétorique et le commentaire, ou encore la théorie et la critique, pour reprendre la 
terminologie proposée plus tard dans l' Introduction à l'étude des textes* et fondée sur 
cette opposition entre le général et le particulier, ont donc bien pour point commun, comme 
tout discours de savoir, de penser leur objet comme difficile ; mais puisque le statut de cet 
objet différe d'une pratique à l'autre, la construction de sa difficulté a aussi des enjeux 
différents en fonction de la méthode adoptée. Ces deux types de travaux ne poursuivent 
en effet pas plus le méme but qu'ils n'ont le méme objet : alors que la rhétorique est 
tournée, ne serait-ce que virtuellement, vers la production de discours, le commentaire 
cherche à maintenir la lisibilité de textes par définition dotés d'une certaine autorité et 
considérés comme dignes d'étre conservés. 

Si le commentaire est défini comme un discours de savoir portant sur un texte, il se 
construit donc à la fois à partir d'un principe méthodologique de difficulté et à partir d'un 
principe idéologique d'autorité. Ces deux principes permettent conjointement de justifier 
le travail de commentaire, comme l'affirme par exemple Glenn Most dans l'introduction 
au volume des Aporemata consacré à cette pratique critique : 


The authority in question is not self-explanatory: the traces in which its wisdom is lodged 
are ambiguous, scanty, lacunose, difficult, of uncertain application to the multiplicity of 


Charles (1979 : 30). 
Id. (1979 : 28). 
Id. (1995). 
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unforeseen circumstances. If the authority could explain itself; it would presumably not 
require that a commentator come along to do so for it. (Most 1999 : VIII) 

«L'autorité en question n'est pas auto-explicative : les lieux oü se loge sa sagesse sont 
ambigus, étroits, lacunaires, complexes, difficilement applicables à la diversité des 
circonstances imprévues. Si l'autorité pouvait s'expliquer elle-méme, elle n'aurait proba- 
blement pas besoin qu'un commentateur vienne le faire pour elle.» 


2.1.3. Contradiction entre difficulté et autorité dans le commentaire 


Il s'en faut pourtant de beaucoup pour que la coexistence de ces deux principes d'autorité 
et de difficulté soit entiérement pacifique. Les termes de leur conflit sont par exemple 
formulés par Ineke Sluiter dans un article sur le traitement de l'obscurité dans les commen- 
taires produits dans l'Antiquité. Les textes que l'on se donne la peine de commenter sont 
par définition crédités d'une certaine valeur; par conséquent, « they command a positive a 
priori attitude in their readers, a presumption that the text will be important, truthful, and 
good (this includes "clear" )?», «ils requiérent une attitude a priori positive de la part de 
leurs lecteurs, une présomption que le texte sera important, véridique, et de bonne qualité 
(ce qui inclut “clair” )». Or, le simple fait d'entreprendre de les expliquer revient à leur 
attribuer quelque insuffisance : « the very act of writing a commentary or engaging in other 
textual practices implicitly acknowledges that the text is not clear, or it would not be in 
need of exegetical effort®», «l’action même d'écrire un commentaire ou d'entreprendre 
d'autres pratiques textuelles est une reconnaissance implicite que le texte n'est pas clair, ou 
1| n'aurait pas besoin d'effort exégétique ». L'écriture d'un commentaire semble donc avoir 
un double effet contradictoire quant à l'autorité du texte commenté : d'un cóté, le commen- 
taire présuppose cette autorité en méme temps qu'il contribue à la maintenir; mais d'un 
autre, et dans un méme mouvement, il tend à la questionner, voire à la saper, précisément 
en attribuant au texte quelque difficulté. Par conséquent, comme le suggére Glenn Most, 


Commentaries can perhaps also be considered, implicitly at least, as being subversive 
of that authority, inasmuch as they always indicate, by explicit acknowledgement and by 
tacit exertion, the difficulties in making its meaning transparent (not always is obscurity 
its own justification). (Most 1999 : X) 

«Les commentaires peuvent peut-étre aussi étre considérés, au moins implicitement, comme 
étant subversifs vis-à-vis de cette autorité, dans la mesure oü ils indiquent toujours, à travers 
une reconnaissance explicite ou par un effort tacite, les difficultés à rendre sa signification 
transparente (l'obscurité ne comporte pas toujours sa propre justification). » 


On pourrait objecter que ce paradoxe ne semble émerger que dans le cadre d'une 
esthétique privilégiant la clarté au détriment de l'obscurité, et devrait donc faire l'objet 
d'une contextualisation historique plutót que d'un travail théorique. Mais si l'on postule 
un système de valeurs inverse, d'ailleurs plus proche de celui de notre modernité, le 
commentateur se retrouve pris dans une autre contradiction, qu'illustrent notamment 
deux exemples fournis par Gérard Genette au début de son article «Figures » : 


Dans son sonnet à la mémoire du duc d'Osuna, Quevedo écrit : 

Su Tumba son de Flandes las Campanas 

Y su epitaphio la sangrienta Luna. 

Cette lune sanglante qui sert d'épitaphe au guerrier, voilà ce qui nous retient dans ce 
distique, voilà ce qu'on appellerait en poésie moderne une admirable image. Mieux vaut 
ignorer, dit Borges, qu'il s'agit du Croissant turc ensanglanté par les victoires du terrible 
duc : l'image, la vision poétique s'effacerait devant une allégorie sans mystère. Il en 


5. Sluiter (2016 : 34). 
6. Ibid. 
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va de méme des Kenningar de la poésie scandinave : le puissant bison de la prairie de 
la mouette, ce n'est qu'une laborieuse «équation du second degré» : la prairie de la 
mouette, c'est la mer, le bison de cette prairie, c'est le navire. Snorri Sturluson, qui établit 
au xil siècle un glossaire complet de ces métaphores, a commis un acte antipoétique. 
« Réduire chaque Kenning au mot qu'elle représente n'est pas dévoiler des mystéres : 
c'est annuler le poème. » (Genette 1966 : 205) 


Dans les cas où c'est l'obscurité qui est érigée en norme esthétique, le statut du commen- 
taire ainsi que celui de son objet sont donc tout aussi instables que lorsque la valeur du 
texte est censée reposer en partie sur sa clarté. 

Les deux conditions théoriquement nécessaires à l'écriture d'un commentaire semblent 
à la fois incompatibles non seulement entre elles, mais également avec la démarche 
critique elle-méme — du moins lorsque la difficulté est considérée comme une propriété 
inhérente au texte étudié, et non comme le résultat accidentel du passage du temps. En 
effet, quels que soient les cas de figure que l'on imagine abstraitement, un paradoxe se 
fait jour. Si le texte commenté ne remplit qu'un seul des deux critéres énoncés plus haut, 
son commentaire apparait comme vain soit dés son point de départ (pourquoi commenter 
un texte déjà parfaitement clair ?), soit du point de vue de son but (à quoi bon commenter 
un texte sans valeur?). À plus forte raison, un texte considéré comme à la fois facile et 
de piètre qualité devrait en toute logique être exclu du champ critique professionnel. Or, 
dans le cas — sans doute le plus intéressant — où le texte est considéré comme difficile et 
valorisé, entre autres, comme tel, son commentaire n'en court pas moins le risque d'étre 
non seulement inutile, mais même dommageable : expliquer le texte, ce serait alors du 
méme coup lui ôter ce qui fait sa valeur. 


2.2. Une solution rhétorique 


Si l'on admet que le principe d'autorité et le principe de difficulté constituent des traits 
caractéristiques et définitoires du commentaire de texte, il semble pour le moins difficile de 
les concilier d'un point de vue strictement logique. Ce probléme en tant que tel appartient 
au champ épistémologique ; mais il est possible d'en tirer des conclusions intéressantes 
sur le plan rhétorique. 


2.2.1. Rhétorique du commentaire 


L'examen de ce que l'on croit pouvoir identifier comme deux présupposés fondamentaux 
du discours critique conduit en effet à envisager une situation paradoxale, voire contradictoire. 
Souligner cette contradiction apparente ne revient pourtant en aucun cas à remettre en 
question les nombreux intéréts de la pratique du commentaire, ni méme, d'une maniere 
générale, à l'évaluer d'un point de vue épistémologique. Il s'agit au contraire de prendre 
en compte les effets réels ou possibles de cette situation initiale dans son écriture méme, 
en l'étudiant, donc, d'un point de vue rhétorique. 

La rhétorique du commentaire peut étre définie à la fois en tant que méthode et en tant 
qu'objet. Comme méthode, elle consiste à envisager le commentaire non pas comme un 
texte unifié et fixé, mais comme un discours dont les procédés sont susceptibles d'étre 
classés, théorisés et reproduits. Comme objet, elle suppose l'existence et le déploiement, 
dans le genre critique, d'un certain nombre de procédés argumentatifs. Cela découle du 
statut du commentaire ou du discours à ambition scientifique sur les textes littéraires en 
général, si l'on admet avec Stanley Fish que ces activités critiques relèvent d'un «modèle 
persuasif» («model of persuasion») et non d'un «modèle démonstratif» («model of 
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demonstration»). C'est précisément la formulation de l'opposition entre ces deux 
modeles et la prééminence du premier par rapport au second qui poussent Richard Tarrant 
à affirmer, dans un ouvrage consacré à l'édition des textes anciens, que la critique textuelle 
reléve de la rhétorique : 


To classify textual criticism as a form of rhetoric is a way of highlighting the fact that its 
arguments depend on persuasion rather than demonstration. [...] Facts do, of course, play 
an important part in textual arguments. But in the end the facts cannot yield a definitive 
answer, only a relative probability, which is where the critic needs to employ rhetorical 
argument. (Tarrant 2016 : 41) 

« Classer la critique textuelle comme une forme de rhétorique est une maniére de mettre en 
lumiére le fait que ses arguments dépendent de la persuasion plutót que la démonstration. 
[...] Les faits jouent, bien sûr, un rôle important dans les arguments textuels. Mais au bout du 
compte, les faits ne peuvent appuyer une réponse définitive, mais seulement une probabilité 
relative, et c’est là le point où le critique a besoin d'employer une argumentation rhétorique. » 


Ces réflexions peuvent bien sûr s'appliquer également à des pratiques moins spécifiques 
que la critique textuelle. On peut donc formuler l’hypothèse que le recours à la difficulté 
dans le commentaire fait partie de ces procédés de persuasion et permet de justifier le 
travail du commentateur. 


2.2.2. Rhétorique de la difficulté 


La difficulté posée par le texte apparait en effet comme une justification a priori nécessaire 
au travail du commentateur, ce qui produit un certain nombre d'effets dans la construction 
du discours critique lui-méme. En théorie, le commentaire présuppose la difficulté, 
puisqu'elle est à l'origine de son écriture ; en pratique, elle peut ou non étre énoncée 
explicitement sous la forme d'un jugement sur le texte, y compris sur le mode de la 
réfutation. En discours, trois attitudes vis-à-vis de cette difficulté initiale sont dés lors 
envisageables : le silence — on se contente de commenter tel ou tel passage du texte, ce 
qui ne fait jamais que sous-entendre qu'il pose probléme; la rhétorique de la difficulté à 
proprement parler — on qualifie alors par exemple le texte de difficile, d'obscur, d'énig- 
matique, d'incompréhensible etc. ; la rhétorique de l'évidence — on utilise au contraire 
des tournures propres à montrer que le texte coule de source, ce qui se fonde toutefois sur 
l'idée que d'autres lecteurs réels ou supposés ne l'ont pas perçu immédiatement. Dans 
tous les cas, la difficulté est susceptible d'étre valorisée ou condamnée, aussi bien en 
fonction de la norme esthétique en vigueur de facon générale que de celle que souhaite 
promouvoir tel commentateur en particulier. De fait, il est toutefois assez rare de trouver 
des jugements de valeur négatifs dans la production critique savante, où le présupposé de 
l'autorité et de la valeur du texte n'est qu'exceptionnellement remis en question. 

La stratégie critique la plus répandue pour concilier autorité et difficulté consiste donc 
à valoriser cette dernière, lorsqu'elle est mentionnée. Cette valorisation passe le plus 
souvent par une intentionnalisation de la difficulté. La valeur accordée à l'obscurité et son 
caractère intentionnel ou non sont d'ailleurs les deux critères retenus par Ineke Sluiter dans 
sa typologie relative à la place de cette notion (qui n'est jamais qu'une certaine modalité 
de la difficulté) dans la tradition exégétique ancienne. Comme elle le fait remarquer, 


The most interesting category in [her] fourfold typology is probably the diagnosis that a text 
is obscure, that it is intentionally so, and that the author is to be commended for making it 
so. This category is strongly represented in the commentary tradition. (Sluiter 2016 : 38) 

«La catégorie la plus intéressante de [sa] typologie à quatre termes est probablement celle 
oü l'on trouve le diagnostic affirmant que le texte est obscur, qu'il l'est intentionnellement, 


7. Fish (1980 : 365). 


L'autométatextualisation de la difficulté : étude d'un procédé critique 147 


et que l'auteur doit étre loué pour l'avoir rendu tel. Cette catégorie est largement représentée 
dans la tradition du commentaire. » 


Ce cas de figure apparait en effet à la fois comme le plus fréquent et le plus digne d'étre 
étudié dans un premier temps, dans la mesure oü il semble spécialement représentatif de 
la facon dont peut se déployer, dans le commentaire, une rhétorique de la difficulté dont 
la fonction serait de déjouer le paradoxe qui préside à sa propre écriture. 


2.2.3. L'autométatextualisation de la difficulté 


Parmi différentes stratégies d'intentionnalisation possibles, l'autométatextualisation de 
la difficulté se distingue notamment par son efficacité pour concilier les deux principes 
contradictoires mentionnés plus haut. L'autométatextualisation, telle qu'elle est définie 
par Florian Pennanech dans sa poétique de la critique, consiste en général à transformer 
le texte étudié en son propre commentaire. En droit, tout élément de n'importe quel texte 
est susceptible d’être interprété comme un élément autométatextuel ; dans les faits, les 
critéres permettant d'accréditer de telles affirmations varient selon les communautés 
interprétatives, les métaphores métapoétiques qui y sont unanimement reconnues, et 
plus généralement la plus ou moins grande fortune qu’y trouve l'idée selon laquelle la 
littérature ne parlerait jamais que d'elle-méme. Quoi qu'il en soit, cette opération semble 
avoir pour principal effet d'accréditer tel ou tel jugement critique. Le commentaire est alors 
autorisé du point de vue de son contenu : une fois établi que le texte contient, explicitement 
ou non, un énoncé que l'on peut réduire à la forme «je suis X», le jugement «le texte 
est X » peut être repris par le commentateur comme nécessairement valide ; le métatexte 
ou plutót l'allométatexte se présente alors simplement comme le lieu de transposition 
d'un jugement déjà énoncé dans ce qui est devenu un autométatexte. 

L'autométatextualisation ne permet toutefois pas tout à fait par elle-méme de légitimer le 
discours critique du point de vue de sa démarche : si le texte livre déjà sa propre explication, 
il peut en effet sembler vain d'en fournir une simple réduplication dans un commentaire. 
Cette opération sauvegarde sans doute mieux que jamais le principe d'autorité à l'oeuvre 
dans le discours critique, mais ne résout pas nécessairement le probléme de sa coexistence 
avec un principe de difficulté. Or, il se trouve un cas de figure qui semble pouvoir répondre 
simultanément à ces deux exigences : celui où les énoncés autométatextualisés contiennent, ou 
se voient attribuer, une référence à la difficulté du texte. Le commentaire est alors doublement 
légitimé, puisqu'il se justifie aussi bien du point de vue de son contenu que, surtout, du 
point de vue même de son énonciation : une fois établi que le texte s'autodésigne comme 
difficile, il est d'une part possible de reprendre ce jugement en l’énonçant explicitement, 
dans le cadre d'une rhétorique de la difficulté ; mais il devient d'autre part et surtout utile, 
voire nécessaire d'en proposer un commentaire — au sein duquel bien d'autres jugements 
critiques que celui de la difficulté pourront in fine étre proposés. 

L'autométatextualisation de la difficulté apparait donc comme un procédé critique 
extrémement productif en ce qu'elle permettrait non seulement d'intentionnaliser, donc 
de valoriser et d'autoriser une difficulté initiale indispensable au commentaire, mais aussi, 
par là méme, de légitimer ce dernier dans son ensemble. 


3. L'AUTOMÉTATEXTUALISATION DE LA DIFFICULTÉ À PARTIR DES COMMENTAIRES À 
L’ALEXANDRA DE LYCOPHRON 


L’autométatextualisation de la difficulté semble donc constituer une réponse possible aux 
contraintes génériques qui informent le discours critique; aprés avoir identifié sa place 
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dans une rhétorique du commentaire, il convient d’en étudier le fonctionnement dans la 
réalisation d'un certain nombre d'énoncés critiques. 

Les commentaires aux premiers vers de l’ Alexandra de Lycophron offrent un corpus 
d'exemples intéressant pour étudier les différentes formes de cette opération dans le 
discours critique. La tradition critique relative à l'Alexandra est marquée dès les premiers 
témoignages par l'idée d'obscurité, comme le rappelle Aurélien Berra dans un article 
consacré à l'obscuritas lycophronea?, que la plupart des commentateurs présentent 
comme proverbiale. La difficulté du texte de Lycophron fait donc l'objet d'un consensus 
critique qu'il ne s'agit pas de remettre en cause. De même, les premiers vers du poème 
sont généralement compris comme un commentaire de ceux qui vont suivre. La situation 
d'énonciation initiale est pour ainsi dire unanimement définie comme suit : un personnage, 
présenté comme le serviteur du roi Priam, s'adresse à ce dernier et lui annonce qu'il 
s'appréte à lui rapporter les prophéties de Cassandre. L’obscurité du poéme en général 
et la valeur métatextuelle de ses premiers vers sont donc rarement contestées dans les 
commentaires : l'intérét de prendre comme exemples des énoncés à propos d'un texte qui 
ne fait pas, de ce point de vue, l'objet de débats critiques trop violents permet de montrer, 
encore une fois, qu'il ne s'agit pas ici de s'intéresser à la validité des interprétations 
proposées (qui, en l'occurrence, ne divergent que marginalement), mais bien plutót à la 
manière dont elles sont construites et justifiées en discours. 

Il s’agit donc notamment d’étudier la façon dont l’autométatextualisation de la difficulté 
construit et transforme des énoncés permettant d’établir, d’abord, que le texte parle de 
lui-même, puis qu’il se désigne comme difficile, pour autoriser enfin directement des 
jugements tels que «le texte est difficile » et justifier ainsi de le commenter. 


3.1. Fragmentations 


Puisque l’autométatextualisation de la difficulté consiste d’abord à produire des énoncés 
de type : «tel élément du texte dit de tel autre élément du texte qu'il est difficile», il 
convient dans un premier temps d'étudier comment ces différents éléments sont distingués 
et se voient attribuer respectivement une dimension métatextuelle et un caractère obscur. 


3.1.1. Délimitation du métatexte 


Une premiére étape de l'autométatextualisation consiste à délimiter l'élément du texte 
auquel on accorde un statut de commentaire. Cette délimitation peut notamment se fonder 
sur des critères relatifs à la situation d'énonciation. Les premiers vers de l'Alexandra sont 
ainsi généralement isolés du reste du poéme parce qu'ils sont attribués au personnage du 
garde, et non à la prophétesse. Ce critére permet dans un premier temps d’isoler et d'unifier 
les trente premiers vers du poéme. Dans l'édition des Belles Lettres par André Hurst et 
Antje Kolde, ils sont par exemple désignés comme suit : «I* niveau : le messager parle? ». 
Dans l'édition de Simon Hornblower, l'unité des vers 1 à 29 est également soulignée par 
un sous-titre : « /-29 Prologue: the guard S first speech», «1-29 Prologue : premier 
discours du garde». Si la subdivision proposée est la même dans les deux cas et repose 
sur le même critère, son expression diffère d'un commentaire à l'autre : dans le premier 
exemple, elle passe par une courte phrase qui constitue un résumé du passage; dans le 
second, elle prend une forme nominale et insiste sur l'appartenance générique du passage. 


8. Berra (2009 : 259-318). 
9. Hurst & Kolde (2008 : 89). 
10. Hornblower (2015 : 120). 
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L'emploi du terme «prologue» mérite d'ailleurs quelques remarques : en français 
comme en anglais (et sans doute dans d'autres langues encore), il appartient en particulier 
au vocabulaire du théátre. Comme le rappelle Gérard Genette : 


Le terme prologue, qui désigne dans le théátre antique tout ce qui, dans la piéce méme, 
précède l'entrée du chœur, ne doit pas induire en erreur : sa fonction, plutôt que de 
présentation et encore moins de commentaire, est d'exposition, au sens dramatique du 
mot, le plus souvent (ainsi chez Eschyle et Sophocle) sous forme de scéne dialoguée, 
parfois (chez Euripide) de monologue de personnage. (Genette 1987 : 54) 


L' Alexandra étant parfois considérée, du point de vue de son genre, comme un monologue 
tragique, le terme de prologue devrait pouvoir, dans ses commentaires, renvoyer à ce 
sens restreint et spécialisé. Les commentateurs attribuent en effet souvent une fonction 
d'exposition à l'ensemble des vingt-neuf premiers vers, qu'ils divisent toutefois en deux 
parties égales. Aprés le commentaire du vers 15, on trouve par exemple dans les notes 
des Belles Lettres la transition suivante : 


On parvient ainsi à la moitié du prologue. Ce premier segment sert à poser le décor. On se situe 
dans un premier degré de la fiction : le messager parle au roi (dont on ne connait pas encore 
l'identité). Les quinze vers qui suivent nous transportent dans un second degré de la fiction : le 
messager prend la place du «poéte» et se met à raconter. (Hurst & Kolde 2008 : 92) 


Ce qui permet de délimiter une premiére et une seconde partie dans ce prologue est encore 
une fois un critére d'énonciation, rendu par des métaphores spatiales : les deux «niveaux» 
ou «degrés» du texte se distinguent en effet par le passage d'un régime discursif à un 
régime narratif. Dans un premier temps, conformément au résumé proposé en sous-titre, 
«le messager parle»; dans un deuxiéme temps, 1l «se met à raconter». Ce dont parle le 
messager dans les quinze premiers vers ne semble donc pas avoir de fonction par rapport 
à l'intrigue. Appliqué plus spécifiquement à ces quinze premiers vers, le terme prologue 
semble dès lors prendre un sens plus général et être employé comme l'un des nombreux 
parasynonymes susceptibles de désigner « l'instance préfacielle », définie par Genette comme 
«toute espéce de texte liminaire (préliminaire ou postliminaire), auctorial ou allographe, 
consistant en un discours produit à propos du texte qui suit ou qui précède !! ». Il semble 
en effet que la désignation de l'ensemble des trente premiers vers comme prologue, puis 
l'isolement de sa premiére moitié selon un critére modal permettent aux critiques d'attribuer 
au passage non pas seulement une fonction d'exposition, mais bien une fonction méta- 
textuelle. Le commentaire de Simon Hornblower, qui reprend là encore la division opérée 
par André Hurst et Antje Kolde, semble confirmer cette hypothése. Aprés avoir séparé les 
quinze premiers vers de la suite du passage, en proposant un nouveau sous-titre strictement 
quantitatif, « /-15 Prologue: first part», il justifie ainsi cette division : 


The first half of the prologue explains what the guard is doing, and provides the first 
characterization of Kassandra. In the second half, the prologue ceases to be self- 
referential, and embarks on a narrative which leads easily into Kassandra’ own narrative. 
(Hornblower 2015 : 120) 

«La premiére moitié du prologue explique ce que le garde est en train de faire, et offre la 
première caractérisation de Cassandre. Dans sa seconde moitié, le prologue cesse d’être auto- 
référentiel, et se lance dans un récit qui conduit naturellement au propre récit de Cassandre.» 


Une fois encore, c'est en raison de la transformation du discours en récit que la premiere 
partie du prologue est isolée du reste du texte ; mais en l'occurrence, l'objet du discours est 
précisé, et cet objet est justement le discours du garde — ce qui est bien sûr explicitement 
indiqué par l'adjectif «autoréférentiel ». 
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C'est ce troisième critère qui permet en définitive d'attribuer une dimension métatextuelle 
au texte commenté. Les deux critéres relatifs au changement d'énonciateur et au mode 
discursif renforcent la distance supposée par la relation métatextuelle; mais il convient 
aussi et surtout d'établir que l'objet du discours ainsi délimité est bien textuel ou du 
moins langagier. Le repérage et la citation de termes métalinguistiques permettent de 
soutenir cette idée, comme dans cette partie du commentaire de Gérard Lambin intitulée 
«L'homme des paroles» : «“Je dirai" (A&E). La simplicité de cette attacca bouleversa Pascal 
Quignard. Le premier mot, le premier coup d’archet, annonce que l’œuvre est paroles. ?» 
La fragmentation est ici encore plus précise que dans les cas précédents, dans la mesure 
ou elle isole le premier mot du poéme, ce qui renforce l'idée que le début du texte remplit 
une fonction préfacielle. Dans cet exemple, le discours du garde ne porte pas seulement 
sur son propre discours, ni sur celui de Cassandre, mais sur l’œuvre en général. Par un effet 
d'inversion, l’œuvre peut également se voir elle-même attribuer comme thème principal 
le langage et la parole : une autre partie du commentaire de Gérard Lambin s’intitule 
d'ailleurs «Une poétique de la parole *». La fragmentation du texte et l'attribution d'une 
fonction préfacielle à ses premiers vers, voire à ses premiers mots, peuvent donc aussi bien 
permettre de délimiter précisément un passage métatextuel qu'autoriser une généralisation 
de l'autométatextualisation en donnant à l'ensemble du texte une valeur métapoétique. 
Il y asans doute des distinctions à établir entre une valeur métatextuelle à proprement parler, 
par rapport à une valeur métalittéraire, métalinguistique ou métapoétique, etc.; il semble 
toutefois qu'au bout du compte, il ne s'agisse là que de changements d’échelle, la fonction 
d'autorité restant la m&me : établir que le texte parle du langage ou de la littérature en 
général plutót que, strictement, de lui-méme, autorise en fait à considérer qu'il exemplifie 
les principes et les jugements qu'il énonce dans sa propre écriture. 


3.1.2. Établissement du contenu du commentaire 


Le contenu non seulement thématique, mais également prédicatif de l'autocommentaire 
constitue un autre critére d'identification et de délimitation des fragments à valeur méta- 
textuelle. L'autométatextualisation de la difficulté consiste en effet à établir que le texte parle 
de lui-méme (ou en tout cas, d'un objet langagier auquel il est facile de le rapporter), mais aussi 
que cet autocommentaire contient un jugement relatif à sa difficulté. Dans les commentaires 
au prologue de l' Alexandra, ce jugement particulier est donc également un critère pour isoler 
et unifier les quinze premiers vers du texte. C'est le cas dans l'édition des Belles Lettres, où 
ils sont désignés sous le titre : «Annonce des paroles obscures (1-15) ^». Dans son édition 
du texte, Emanuele Ciaceri propose quant à lui, dans les notes de bas de page relatives à ce 
passage, de le résumer comme suit : «vv. 1-15. Il custode di Cassandra prima di riferire al 
re Priamo le profezie della fanciulla fa notare la loro oscurità ^ », «le gardien de Cassandre, 
avant de rapporter au roi Priam les prophéties de la jeune fille, fait remarquer leur obscurité ». 
C'est dans les deux cas un terme métalinguistique qui assure l'unité du fragment ainsi détaché 
du reste du texte, que ce soit sous la forme d'un substantif («annonce») ou d'un verbe de 
parole («riferire» et surtout «fa notare») ; de plus, le contenu des propos métatextuels du 
garde est précisé : il est explicitement indiqué que son discours fait référence à l'obscurité des 
paroles qu'il s'appréte à rapporter. Une difficulté fréquente dans le discours méta-métatextuel, 
et à laquelle le présent travail n'échappe d'ailleurs probablement pas, se présente alors : 
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l'attribution d'une telle caractéristique aux paroles de Cassandre semble en effet étre prise 
en charge, dans ces énoncés, à la fois par le personnage, devenu une sorte de commentateur 
interne et fictif, et par les commentateurs externes et réels. Le fait que les commentateurs 
n'introduisent aucune distanciation explicite dans la présentation du discours narrativisé produit 
une confusion entre leur point de vue et celui du garde : les syntagmes «paroles obscures» et 
«la loro oscurità» apparaissent ainsi comme des jugements partagés par les commentateurs. 
Il semble que lorsqu'un énoncé métatextuel rapporte le contenu d'un autre énoncé présenté, 
lui aussi, comme métatextuel, les deux niveaux de discours tendent à fusionner. 

Un des effets possibles de l'autométatextualisation est donc de permettre au 
commentateur de faire, en quelque sorte, d'une pierre deux coups : cette opération lui 
fournit en effet un commentaire à la fois du passage identifié comme autométatextuel et 
de l'ensemble du texte dont ce passage serait le commentaire. L'intégration du jugement 
du garde dans le discours critique se fait de facon quasi insensible, ce qui tend à mettre en 
lumière un autre bénéfice de l'autométatextualisation : le contenu de l'autocommentaire est 
indiscutable et n'a pas besoin d'étre justifié, sinon en attribuant un surcroit d'autorité au 
passage autométatextualisé, comme dans cette remarque de Massimo Fusillo qui affirme, 
avant précisément de citer in extenso les quinze premiers vers du poème : 


Questa componente riflessiva risulta particolarmente evidente nel prologo e nell'epilogo 
che incorniciano la profezia stessa; soprattutto il prologo, che contiene le parole che il 
custode rivolge a Priamo per descrivergli l'oscuro linguaggio di Cassandra, si configura 
come una vera e propria dichiarazione di poetica. (Fusillo 1984 : 503) 

« Cette composante réflexive apparait comme particuliérement évidente dans le prologue 
et l'épilogue qui encadrent la prophétie elle-même; le prologue, surtout, qui contient les 
paroles que le garde adresse à Priam pour lui décrire l'obscur langage de Cassandre, est 
configuré comme une véritable déclaration de poétique. » 


Dans cet exemple comme dans les précédents, le segment «/'oscuro linguaggio di 
Cassandra» et le jugement qu'il implique sont à attribuer aussi bien au commentateur 
qu'au garde ; mais de plus, ce jugement est explicitement rattaché à la formulation d'un 
projet poétique, ce qui renforce l'autorité du prologue. 


3.2. Superpositions 


Les procédures décrites jusqu'à présent permettent de distinguer à l'intérieur du texte 
différents moments, dont l'un est considéré comme métatextuel et qualifie le reste du 
texte d'obscur. L'autométatextualisation repose donc sur un certain nombre d'opérations 
critiques qui relévent de la fragmentation. Elle produit pourtant également des effets qui 
donnent lieu à une forme de confusion entre différents énonciateurs : dans les exemples 
qui viennent d'étre cités, le texte et son commentaire semblent en effet parler d'une 
méme voix. Il arrive également que le commentaire multiplie les instances énonciatives 
auxquelles est attribué l'autométatexte, ce qui produit d'autres effets de superposition 
qui permettent de renforcer encore, à des degrés divers, l'autorité du jugement proposé. 


3.2.1. Autométatextualisation actoriale 


La fonction métatextuelle attribuée au prologue l'assimile d'emblée partiellement à une 
préface ; mais dans la quasi-totalité des exemples précédents, le jugement d'obscurité est 
d'abord présenté comme étant le résultat d'un énoncé produit par le garde. Cette configu- 
ration s'assimile à ce que Gérard Genette appelle une instance préfacielle actoriale '6, qui 
émane donc d'un personnage. Si l'on s'en tient à ce dispositif, il est alors tout à fait possible 
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de se désolidariser des jugements énoncés par le garde, comme le fait d’ailleurs partiellement 
Simon Hornblower au début de son commentaire du prologue : «we are almost immediately 
transported mentally to the roofless stone cell where the king s daughter Kassandra has 
been imprisoned, and out of which she rushes to deliver her long and — despite 5 — coherent 
speech of prophecy " », «nous sommes presque immédiatement transportés mentalement 
dans la cellule de pierre dépourvue de toit où la fille du roi, Cassandre, a été emprisonnée, et 
depuis laquelle elle se presse de délivrer son long et — malgré le vers 5 — cohérent discours 
prophétique ». La structure concessive «despite 5» indique une opposition explicite à la 
désignation du discours à venir par l'expression «zapquyfj Boñv», prise en charge par le 
garde au vers 5. Les remarques métatextuelles actoriales peuvent donc parfaitement étre 
utilisées comme contrepoint au discours critique, et non pas directement comme arguments 
destinés à appuyer les jugements du commentateur. 

Il est toutefois également possible de modifier le régime énonciatif dont procéde 
l'autométatexte ainsi identifié, afin d'accroitre son autorité : il s'agirait donc, par exemple, 
de passer d'un autométatexte actorial à un autométatexte auctorial. Considérer le prologue 
de l'Alexandra comme une «déclaration de poétique », pour reprendre les termes de 
Massimo Fusillo cités plus haut, revient en fait à ébaucher cette transformation, comme 
on peut le comprendre à partir de cette remarque de Christophe Cusset et Cédric Chauvin : 
«On a souvent commenté le prologue que dit le serviteur avant sa répétition des propos 
d'Alexandra, en y lisant une caractérisation à valeur métatextuelle de la parole de cette 
dernière, voire de la poétique de Lycophron. ^» Le passage d'une valeur métatextuelle 
actoriale à une valeur métapoétique auctoriale, marqué par l'adverbe d'enchérissement 
« voire », suppose d'attribuer le prologue non plus au seul personnage du garde, mais 
directement à Lycophron. Cette double attribution est le résultat d'un mouvement 
métaleptique, qui fait ici se superposer un énonciateur fictif et un énonciateur réel. 

La maniére la plus simple et la plus efficace de passer d'un régime actorial à un régime 
auctorial consisterait, à premiére vue, à assimiler directement le personnage du garde 
et l'auteur supposé du texte, Lycophron. On trouve une trace d'une telle opération dans 
le préambule des scholies anciennes à l'Alexandra, dont la première phrase conservée 
est la suivante : « lotéov 6 ó TH Kaoávópo naptotápievog oikétrj avtevouévn ADTOG 
ovtoc Tv ó Avkógpov 6 tod ITpi&uov droypapebc, óc napa tod Tpiáuov émitaysic Kove 
TOV tfj Kacävôpa Aeyopévov: 0vyótnp yap Mpiáuov À Kacávópa ? », «Il faut savoir 
que le serviteur qui s’est tenu auprés de Cassandre alors qu’elle rendait ses oracles était 
lui-méme le scribe de Priam, Lycophron, qui, suivant les ordres de Priam, écoutait les 
paroles prononcées par Cassandre : Cassandre est en effet la fille de Priam. » On pourrait 
sans doute objecter que cette identification directe n'est jamais que le résultat du supposé 
manque d'information — voire de méthode — des scholiastes, et qu'elle ne prend aucune 
part à une stratégie rhétorique, quelle qu'elle soit. Une réponse possible à cette objection 
consisterait à rappeler qu'il ne s'agit, encore une fois, ni d'évaluer la pertinence de tel ou 
tel jugement, ni de s'adonner au moindre procès d' intention ; mais il faut admettre que cette 
opération, telle quelle, ne contribue en fait qu'en apparence à une autométatextualisation 
auctoriale. Certes, en identifiant le serviteur de Priam avec Lycophron, cette ouverture 
des scholies fait bien de l'auteur du texte le responsable direct des jugements énoncés 
dans le prologue. En cela, il semble donc possible et légitime d'affirmer avec l'auteur 
que le discours de la prophétesse est obscur. Toutefois, cette redéfinition de la situation 
d'énonciation initiale maintient, voire renforce la distinction entre le discours du serviteur 
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Lycophron et celui de la princesse Cassandre : les quinze premiers vers remplissent 
alors sans doute une fonction préfacielle, mais qui s'apparente a une préface allographe; 
l'auteur ne prend plus en charge que le prologue, et le texte perd pour ainsi dire son 
caractère fictionnel pour prendre un statut de témoignage. Les jugements de Lycophron 
ne sont donc jamais présentés que comme des énoncés simplement métatextuels, mais 
pas à proprement parler autoréférentiels : à ce titre, leur auctorialisation n'est donc en 
fait d'aucune utilité, et l'on reste pour ainsi dire dans le cas d'une autométatextualisation 
actoriale. En l'absence de distinction préalable entre le plan de la réalité et celui de la 
fiction, le caractére métaleptique de l'identification entre auteur réel et locuteur fictif est 
en effet considérablement affaibli, voire annulé. 


3.2.2. Autométatextualisation auctoriale 


La métalepse, que Florian Pennanech identifie comme «la figure essentielle du discours 
critique ?», ne peut donc opérer qu'à partir de l'établissement d'une frontiére entre les 
«univers » diégétique et extradiégétique, pour reprendre les termes de la définition donnée 
par Gérard Genette?'. Elle apparait comme une condition nécessaire à l’auctorialisation 
effective et efficace du passage désigné comme autométatextuel. Les «univers» extra- 
textuel et intratextuel doivent en effet coexister, sans toutefois fusionner totalement, pour 
pouvoir attribuer au prologue une portée proprement autoréférentielle. La superposition 
peut se faire de maniére explicite et indirecte, en conservant un terme permettant de 
rapprocher les deux types d'énoncés : «È dunque chiaro che le parole rivolte dal custode 
di Cassandra al re Priamo riflettono l'ardito programma poetico di Licofrone? », «Il 
est donc clair que les paroles adressées par le garde de Cassandre au roi Priam reflétent 
le programme poétique ardu de Lycophron.» Dans cet exemple encore une fois tiré de 
l'article de Massimo Fusillo, les deux énonciateurs et le contenu de leurs propos respectifs 
sont conservés et rapprochés par le verbe «riflettono», qui explicite le lien entre les deux 
selon un procédé reposant sur le méme principe que toute lecture allégorique. On peut 
remarquer que cette justification du jugement d'obscurité, qui transparait dans l'asso- 
ciation de l'adjectif «ardito » au programme poétique de l'auteur, s'exprime elle-méme, 
paradoxalement, à travers une rhétorique de l'évidence. 

Plus simplement et directement encore, il est possible d'attribuer à l'auteur du texte 
la responsabilité d'une expression telle qu'elle est employée par le personnage du garde 
pour parler du discours de Cassandre. Simon Hornblower commente ainsi un passage 
du douzième vers du poème : 


tav ox0t@: this early allusion to what is hidden in darkness is self-referential and 
programmatic on the part of the poet. The Alexandra was described by the Suda (TrGF 
100 T 3) as the «dark poem », oxoteivov moinua, rendered on the title-page of the Aldine 
ed. Princeps of AD 1513 as «obscurum poema ». (Hornblower 2015 : 123) 

«TOV OKOTO : cette allusion précoce à ce qui est caché dans l'obscurité est auto-référentielle 
et programmatique de la part du poéte. L' Alexandra a été décrite par la Souda (TrGF 100 
T 3) comme le “poème obscur”, oxotetvov noinpa, rendu sur la page de titre de l'édition 
princeps d’Aldine de 1513 comme “obscurum poema" .» 


Au sein de ce que le commentateur a isolé comme le « discours du garde », une expression 
est pourtant explicitement présentée comme un jugement directement pris en charge par 
l'auteur : l'obscurité du texte apparait alors comme un projet poétique intentionnel, et non 
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pas seulement comme une caractéristique du discours prophétique. Les termes isolés par 
le commentateur dans cette note, « tàv oKót® », prennent alors un statut ambivalent qui 
les situe à la frontière du monde intratextuel et du monde extratextuel : ils sont présentés 
à la fois comme une citation tirée du texte et du discours du garde, et comme un 
autocommentaire proposé par l'auteur. Il est intéressant de constater que cette double 
dimension est encore compliquée par la référence à d'autres commentaires, cette fois 
clairement extratextuels et allographes, et pourtant cités dans la foulée de cette super- 
position initiale. L'autocommentaire est ainsi justifié ou appuyé par des allocommen- 
taires, et vice versa. L'attribution multiple des énoncés métatextuels relatifs au discours 
de Cassandre peut ainsi faire coexister comme source d'un méme jugement un locuteur 
fictif, un auteur réel, et méme des figures de commentateurs. 


3.2.3. Autométatextualisation opérale 


Il convient toutefois de noter que, dans certains cas, l'autométatextualisation peut méme 
se passer d'une figure d'auteur à proprement parler, sans que cela empéche — au contraire, 
méme — que la difficulté du texte soit intentionnalisée et qu'un commentaire qui l'énoncerait 
soit autorisé et légitimé. On se trouve alors dans le cas d'une autométatextualisation non 
pas actoriale, ni auctoriale, mais «opérale», pour proposer une typologie reprenant à la 
fois les termes de Gérard Genette et ceux de Florian Pennanech. Les énoncés métatextuels 
identifiés dans le poéme ne sont alors plus envisagés comme étant le fait d'un personnage 
à propos du discours d'un autre, ni comme un avertissement de l'auteur à propos de son 
texte : ils émanent directement de l'oeuvre à propos d’elle-méme, sans qu'il y ait besoin 
d'attribuer les jugements d'obscurité à aucune instance extérieure au discours obscur, ce 
qui permet de faire fusionner voire disparaitre les différents énonciateurs proposés jusqu'à 
présent. Les plans thématique et rhématique (selon la définition élargie qu'en propose 
notamment Gérard Genette dans Seuils) sont alors parfaitement superposés puisque le 
prologue renvoie simultanément au discours qui se déploie dans la fiction et à l'oeuvre 
dans son existence réelle, et non pas tantót à l'un et tantót à l'autre selon qu'on attribue le 
discours au personnage ou à l'auteur. On trouve ainsi dans les notes de l'édition des Belles 
Lettres une remarque relative au premier mot du texte : «1. Xé&w Le choix de ce mot est 
révélateur, pour un poéme qui va justement “dire” de maniére énigmatique, donc, d'une 
certaine manière, dire en ne disant pas. ?» La dimension opérale de l'autométatextualisation 
apparaît en particulier dans la construction syntaxique qui fait du syntagme «le poème» 
le sujet du verbe «dire» dans ses diverses occurrences. Les guillemets qui entourent la 
première d'entre elles peuvent soit souligner le caractère impropre d'une telle expression 
et le saut qu'elle suppose de la dimension actoriale ou auctoriale à la dimension opérale, 
soit simplement renvoyer à la citation et à la traduction du verbe employé dans le texte. 
Le terme métalinguistique «A€Em» n'est quant à lui précisément attribué ni au personnage 
du garde, ni à une figure auctoriale, mais directement au poéme, en méme temps donc que 
l'action de dire. Or, les commentateurs intentionnalisent et motivent ce premier mot par 
une justification paradoxale, qui repose précisément sur l'inadéquation partielle supposée 
entre le terme choisi et ce que ferait effectivement le texte — qui «justement», va «dire 
en ne disant pas ». Ce décalage est à nouveau rendu possible par une opération de 
fragmentation, qui permet d’isoler le verbe initial et de le rendre par là méme apparemment 
intransitif : ainsi, le commentaire peut se focaliser sur la «manière» de dire, en faisant 
notamment appel à la notion d'énigme, qui renvoie précisément à une forme de difficulté 
intentionnelle. Dans cette note de bas de page, l'autométatextualisation du premier mot du 
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texte permet d'emblée d’attribuer à l’œuvre une difficulté intentionnelle, alors même que 
le jugement sur le caractére énigmatique du texte est pris en charge par le commentateur. 
L'autométatextualisation de la difficulté peut donc étre indirecte : un énoncé qui ne propose 
pas de jugement relatif à la difficulté du texte, une fois autométatextualisé, peut toutefois 
autoriser un tel jugement de la part du commentateur. 

L'autométatextualisation opérale peut bien sûr aussi directement porter sur la difficulté 
du texte, comme par exemple dans cette remarque de Christophe Cusset et Cédric Chauvin : 


Le texte lui-méme s'affiche comme un texte difficile à comprendre : c'est ce qui est dit 
dans ce qu'on appelle souvent le prologue et qui présente la suite comme un «indicible cri 
disparate» (5), une parole inspirée que, « macheuse de laurier, elle phoibassait du fond de 
sa gorge » (6), «de la Sphinge noirâtre imitant la voix » (7); il s'agit de paroles « obliques» 
(14), «abstrus(es) » (10). (Cusset & Chauvin 2008 : 12) 


La marque d’ipséité et le verbe réfléchi soulignent l'opération d'autométatextualisation, 
dont on comprend qu'elle n'est réellement compléte que lorsqu'elle porte sur le texte et 
non sur un de ses éléments, qu'il soit intra ou extradiégétique. Le jugement de difficulté, 
reformulé dans le commentaire, est appuyé par plusieurs citations qui s’intègrent toutefois 
de plus en plus dans le discours critique : les adjectifs « obliques» et «abstrus(es) », dans 
la derniére partie de la phrase, sont, comme les autres citations du passage, à la fois en 
emploi et en mention, mais ne sont plus modalisés en discours second. La dissolution des 
différents énonciateurs possibles dans l’œuvre s'accompagne donc de la superposition 
de l'autocommentaire et de l'allocommentaire, ce qui autorise ce dernier. 


3.3. Circulations 


L'autométatextualisation de la difficulté, si elle peut procéder aussi bien par fragmen- 
tation que par fusion des différents moments ou niveaux du texte, permet donc au bout 
du compte une circulation du jugement de difficulté du passage autométatextualisé au 
commentaire allographe, mais également d'une partie du texte à son ensemble. La circu- 
lation de la difficulté d'une partie et d'une dimension à l'autre du texte permet d'étendre 
le domaine où peut se déployer la rhétorique de la difficulté et donc, dans le méme temps, 
le commentaire : l'identification d'un autocommentaire ne rend donc pas pour autant vain 
l’allocommentaire, mais permet méme, parfois explicitement, de le justifier d'autant mieux. 


3.3.1. Circulation interne : d'une partie du texte à l'autre 


Les quinze premiers vers du poème, isolés comme une sorte de préface, pourraient par 
exemple sortir du champ d'application de la critique dans la mesure où ils relèveraient 
déjà eux-mémes de la critique. Or, les distinctions et glissements opérés dans le cadre 
de l'autométatextualisation permettent de faire entrer ce passage dans le domaine du 
commentaire, en étendant la caractérisation du texte comme difficile aux propos du 
garde. Les jugements du garde à propos du discours de Cassandre peuvent ainsi être 
appliqués à son propre discours. Les énoncés autométatextualisés dans le prologue 
changent parfois partiellement et ponctuellement de statut dans les commentaires, ce qui 
permet de déplacer la difficulté d'un plan à un autre. Certains énoncés du prologue sont 
attribués au seul personnage du garde, tandis que d'autres seront clairement identifiés 
comme des interventions auctoriales, selon les besoins du moment. Comme on l'a vu, 
bien que Simon Hornblower insiste à plusieurs reprises sur le caractére autoréférentiel et 
métapoétique du prologue, il peut également à l'occasion remettre en question la validité 
des remarques du garde, précisément pour souligner une difficulté supplémentaire dans 
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le texte. Son commentaire de l'expression «zapptyy Borjv» au vers 5 offre un exemple 
de ce cas de figure : 


The difficulty of this is not always faced in modern discussions. Kassandra 5 prophecies, as 
the messenger reports them, are not a confused set of cries at all. This is, in fact, a partly 
«misdirecting prologue », like for instance that of Hermes in E. lon. (Hornblower 2015 : 121) 
«La difficulté de ce point n'est pas toujours affrontée dans les discussions modernes. Les 
prophéties de Cassandre, telles que le messager les rapporte, ne sont absolument pas un 
ensemble de cris confus. Il s'agit, en fait, d'un prologue en partie “trompeur”, comme par 
exemple celui d’Hermès dans l’/on d’Euripide. » 


L'expression du garde renvoie à une certaine forme de difficulté, à travers l’adjectif 
«ray » que l'on peut traduire par «confus » : il serait donc possible non seulement 
d'autométatextualiser mais aussi d'auctorialiser, voire d'opéraliser ce jugement du garde, 
en estimant qu'il s'agit une fois de plus d'un avertissement adressé au lecteur quant au 
caractére obscur du discours de Cassandre. Or, dans ce cas, c'est une autre stratégie qui 
est adoptée. Le jugement énoncé par le garde est réfuté du point de vue de son contenu, et 
la difficulté, sous la modalité de la confusion, est donc provisoirement refusée au discours 
de Cassandre ; mais elle peut alors étre attribuée au discours du garde et à l'emploi méme 
du terme, qui passe pour un indice d'ambiguité et de ruse — une ruse qui peut elle-méme 
aussi bien étre attribuée à l'auteur du texte qu'au personnage : bien que ce jugement soit 
présenté comme inadéquat, son caractère intentionnel est explicité par la catégorisation 
«prologue trompeur », le terme générique renvoyant plutôt à une figure auctoriale, ainsi 
que par la comparaison avec un autre exemple d’un tel procédé, qui fait au contraire 
explicitement référence à la ruse employée par le personnage d'Hermés. La combinaison 
des différentes instances énonciatives possibles sur lesquelles repose l’autométatextua- 
lisation permet donc une production de la difficulté au service du commentaire, qui se 
distingue par là même des travaux précédents. 

À la circulation de la difficulté en fonction de ces différents critères s’ajoute en effet 
une intertextualité critique, elle aussi caractéristique de la rhétorique du commentaire. 
Une difficulté peut surgir, sans avoir été perçue par les commentateurs précédents, mais 
elle peut également être reprise dans une tradition critique. Ainsi, dans son commentaire 
au premier vers du texte, Simon Hornblower fait les remarques suivantes : 


The guard speaks in the difficult language of Kassandra herself, as Wilamowitz 1924 : 2. 
147 n. 2 observed («Der Bote redet nicht anders als Kassandra») : vatpexne is a highly 
unusual alternative form of atpexne [...]. The two speakers also have certain favourite 
words in common. (Hornblower 2015 : 121) 

«Le garde parle le langage difficile de Cassandre elle-même, comme l'a observé 
Wilamowitz 1924 : 2. 147 n. 2 ( “Le garde ne parle pas autrement que Cassandre” ) : 
vmtpgkris est une forme concurrente hautement inhabituelle de &tpekńg [...]. Les deux 
locuteurs ont aussi certains mots favoris en commun. » 


La difficulté circule ici du discours de Cassandre à celui du garde à partir d'un critére 
stylistique et plus précisément lexical; ce jugement est appuyé par la référence à un 
commentaire précédent, dont la citation proposée ici ne mentionne toutefois pas l'obscurité 
mais simplement la similarité entre les deux discours. Il est toutefois possible d'intégrer 
ce jugement dans une rhétorique mentionnant explicitement l'obscurité du texte, comme 
le fait également Gérard Lambin : 


Il n'est pas seulement un porte-parole, justifié par une volonté de «mise en abyme», 
mais dont le poéte aurait pu faire l'économie en laissant parler directement Cassandre- 
Alexandra. Son discours personnel (vers 1 à 30, puis 1461 à 1474, qui renvoient l'écho 
des premiers) n'a-t-il pas la même obscurité que les prophéties introduites et conclues par 
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lui? Cet humble personnage parle comme la princesse inspirée par Apollon. Wilamowitz, 
notamment, le remarquait. (Lambin 2005 : 211) 


La fonction préfacielle et autométatextuelle du discours du garde est ici mise au second 
plan par rapport à son obscurité. La difficulté circule donc du discours de Cassandre au sien, 
dans un mouvement d'homogénéisation qui permet de réinsérer le passage métatextuel dans 
l'ensemble du poème, tout en lui attribuant précisément les caractéristiques qu'il énonce. 

À l'échelle d'un terme ou d'une expression, une opération semblable fait parfois 
circuler la difficulté du signifié au signifiant : un terme dénotant l'obscurité peut lui-méme 
faire l'objet d'un commentaire en raison des difficultés qu'il pose, également sur fond 
d'intertextualité, voire de débat critique. L’adjectif « keAatwijc», au vers 7 du poème, se 
voit par exemple attribuer une double signification possible, dont l'une seulement est 
métatextuelle, comme dans ce commentaire de George Mooney : 


7. The epithet xcAauvijc may denote either the dark nature of the Sphinx s riddle (cf. Stat. 
Silv. 5. 3. 157, latebrasque Lycophronis atri) or, more probably, her cruelty toward the 
Thebans who failed to guess it; then she is called òuóoitoç, Aesch. Th. 541. Bachmann, 
Konze, and others explain xeAatvóg as = horrendus, furiosus in vv. 7, 325, 471, 1169 (but 
cf. Soph. Aj. 231, etc.), 1188 (but cf. Od. 10. 525, etc), 1256, 1425. (Mooney 1979 : 2-3) 
«L’épithète keñavñg peut dénoter ou bien le caractère obscur de l'énigme de la Sphinge 
(cf. Stat. Silv. 5. 3. 157, latebrasque Lycophronis atri) ou bien, comme c'est plus probable, sa 
cruauté envers les Thébains qui ont échoué à la résoudre ; elle est alors appelée o póotoc, 
Aesch. Th. 541. Bachmann, Konze, et d'autres expliquent xeAotvóc comme = horrendus, 
furiosus dans les v. 7, 325, 471, 1169 (mais cf. Soph. Aj. 231, etc.), 1188 (mais cf. Od. 10. 
525, etc.), 1256, 1425.» 


L'argument étayant la première interprétation (même si c’est la seconde qui est explicitement 
présentée comme préférable) consiste en une citation de Stace, qui qualifie Lycophron 
d'obscur : l’obscurité circule donc ici non seulement d'un témoignage de la réception 
du texte au commentaire, mais également de Lycophron à la Sphinge, qui désignent tous 
deux par métonymie les discours énigmatiques qu'ils écrivent ou prononcent. Ce parallèle 
indirect entre l'auteur du texte et la Sphinge se retrouve dans l'édition des Belles Lettres, 
qui propose également une double interprétation pour le terme «keAatvñc», mais semble 
au contraire retenir la première option. L'adjectif et le nom qu'ils qualifient sont d'ailleurs 
commentés d'un seul bloc : 


7. Lowyos xeXowftis «la sombre Sphinge», allusion à l'«obscurité» des énigmes de la 
Sphinge, en méme temps qu'au fait qu'il s'agit de trouver leur solution, comme dans 
l'épisode de la Sphinge de Thébes. Holzinger se demande si l'expression ne fait pas aussi 
allusion à la cruauté de la Sphinge. (Hurst & Kolde 2008 : 91) 


La comparaison proposée par le garde entre Cassandre et la Sphinge est ici justifiée non 
seulement par l'« obscurité » qui caractérise son discours, mais également par la nécessité 
supposée de le déchiffrer. Le commentaire de cette expression est ici justifié à plusieurs 
égards : la difficulté circule en effet du signifié au signe, notamment par le recours à 
d'autres commentaires pour multiplier les interprétations, mais la préférence accordée 
malgré tout à l'interprétation métatextualisante permet de suggérer que cette comparaison 
est aussi un appel à la sagacité du lecteur. 


3.3.2. Circulation externe : vers le destinataire 


La difficulté, à la fois sous l'effet de l'autométatextualisation et de l’intertextualité critique, 
circule donc non seulement d'une partie ou d'une dimension du texte à une autre, mais 
également d'un commentaire à l'autre ; au bout du compte, elle peut également étre expli- 
citement présentée comme passant du texte au commentaire : le texte est alors lu comme 
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une invitation à l'interprétation, et le commentaire se justifie en construisant des figures de 
destinataires. Les effets de superposition précédents concernant l'énonciateur du prologue 
se reproduisent donc du point de vue de sa réception. La situation d'énonciation initiale et 
fictive dans le cadre de laquelle le personnage du garde s'adresse au roi Priam peut donner 
lieu à une double superposition référentielle et historicisante, comme dans ce commen- 
taire de Massimo Fusillo : « Inoltre, il fatto che questo prologo (come poi l'epilogo) sia 
rivolto al sovrano Priamo puo rinviare al destinatario immediato dell'opera licofronea, 
il circolo della corte tolemaica™», «En outre, le fait que ce prologue (comme plus tard 
l'épilogue) soit adressé au souverain Priam peut renvoyer au destinataire immédiat de 
l'eeuvre lycophronienne, le cercle de la cour ptolémaique.» De méme que le personnage 
du garde apparait comme une image de l'auteur voire de son œuvre, de même le person- 
nage à qui 1l s'adresse peut renvoyer à un ensemble de personnes réelles dotées en partie 
des mémes attributs que lui — en l'occurrence, l'appartenance à une classe de pouvoir. 

Ce renvoi aux conditions originales supposées de la réception du texte peut toutefois 
évoluer pour permettre de constituer une figure de destinataire universalisable, celle du lecteur, 
comme dans ce commentaire à l'adresse «ó£onot'» au troisième vers du texte : «3. 6£onoct' 
L'auditeur commence à comprendre que le locuteur est un personnage (tragique : cf. la forme 
métrique) qui s'adresse à un roi — et, à travers ce roi, c’est bien entendu le lecteur qui se trouve 
sollicité.?» Dans cet exemple, la superposition entre le roi et le lecteur permet en quelque 
sorte de court-circuiter l'identification entre le personnage qui parle et une figure d'auteur : 
l'autométatextualisation se fait ici, paradoxalement, de l'extérieur et par la réception. La difficulté 
du texte n'apparait dés lors plus seulement comme une caractéristique du texte, voulue ou non 
par une figure auctoriale, mais elle est considérée du point de vue de ses conséquences et des 
effets qu'elle produit ou doit produire. Dans le commentaire de Gérard Lambin, à quelques 
pages d'intervalle, ces effets sont considérés au sein de la situation d'énonciation fictive puis 
au sein d'une situation d'énonciation réelle. Le défi interprétatif que constitue le discours de 
Cassandre est d'abord considéré du point de vue des personnages : 


Ce langage abscons est le sien du premier au dernier mot, sans qu'il puisse le comprendre 
et faire comprendre vraiment, d'oü la nécessité pour Priam de «recompter» à son tour 
(avareunacov, v. 9) en parcourant «les chants obscurs des énigmes», afin de trouver le 
«passage » à suivre dans l’obscurité (vers 10-12). (Lambin 2005 : 211) 


La méme métaphore du parcours, en partie tirée du texte comme en témoignent les citations 
intégrées au commentaire, est reprise ensuite pour décrire la démarche du lecteur, qui cette fois 
est étonnamment mise en parallèle avec celle du garde et de l’auteur plutôt qu'avec celle du roi : 


Tout se passe en effet comme si Lycophron s'était aussi refusé à donner son poème au 
lecteur pour que celui-ci füt obligé de le mériter en parcourant lentement, difficilement, 
le méme obscur chemin que lui-méme ou que le serviteur d' Alexandra (vers 13 à 15). 
Impossible de glisser à la surface du texte. Le lecteur ou bien renonce ou bien táche de 
franchir les obstacles en connaissant à son tour un peu des joies et des peines de la création 
poétique. (Lambin 2005 : 222) 


Les superpositions terme à terme laissent ici place à une circulation de la difficulté d'un 
plan à un autre : d'un jugement ou principe poétique formulé dans le texte, elle devient 
une expérience qui doit étre partagée par tous ceux qui participent à son élaboration. La 
rhétorique de la nécessité qui formule un lien de cause à effet entre le poème tel qu'il se 
présente et les réactions du destinataire permet de faire entrevoir ce que serait une bonne 
lecture du texte, qui ressemble curieusement à une écriture. 


24. Fusillo (1984 : 504). 
25. Hurst & Kolde (2008 : 89). 
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La difficulté du texte peut donc étre plus ou moins explicitement présentée comme ce 
qui encourage et par là m&me justifie l'interprétation, voire son expression dans l'écriture 
d'un commentaire. L'idée d'une productivité non seulement littéraire mais également 
critique de la difficulté est notamment exprimée par Ineke Sluiter, lorsqu'elle évoque 
l’Alexandra comme un exemple de texte particulièrement obscur : 


The poem starts clearly enough, with an announcement that it will report the incomprehen- 
sible and obscure oracular utterances of Cassandra, which means that explicit attention 
is called to the obscurity and difficulty of what follows. The girl, it is said in the opening lines 
of the poem, is unclear; she confuses everything; she is like dark (kelainés) Sphinx, speaking in 
riddles (ainigmata); she is obscure (skotos) as befits a prophetess of Apollo Loxias (whose 
second name also means «the obscure»). So in order to be a success, the poem must be 
obscure. And of course, intriguingly, the poem somehow holds out the promise of deci- 
pherability and thereby incites the reader to invest enormous amounts of exegetical energy 
in it. As a survival strategy, this was successful indeed: the Alexandra was a tremendously 
popular text with an extremely rich textual tradition. (Sluiter 2016 : 47-48) 

«Le poème commence assez clairement, en annonçant qu'il rapportera les paroles oraculaires 
aussi incompréhensibles qu'obscures de Cassandre, ce qui signifie qu'on attire explicitement 
l'attention sur l'obscurité et la difficulté de ce qui suit. La jeune fille, comme cela est dit dans 
les vers qui ouvrent le poéme, n'est pas claire : elle confond tout; elle est comme la sombre 
(kelainés) Sphinge, car elle parle par énigmes (ainigmata); elle est obscure (skotos) comme 
il convient à une prophétesse d' Apollon Loxias (dont le deuxiéme nom signifie également 
“lobscur” ). Dès lors, pour être réussi, le poème doit être obscur. Et bien sûr, d'une façon 
intriguante, le poéme offre d'une certaine facon la promesse de sa déchiffrabilité et incite 
par là méme le lecteur à déployer dans son interprétation une quantité considérable d'énergie 
exégétique. Comme stratégie de survie, ce fut en effet un succès : l'Alexandra fut un texte 
remarquablement populaire accompagné d'une tradition textuelle extrémement riche.» 


L'autométatextualisation est immédiatement suivie d'une conséquence supposée du cóté 
de la réception : le poéme s'annonce comme difficile, ce qui signifie qu'il cherche à attirer 
l'attention, vraisemblablement, d'un lecteur; cette obscurité explicite est présentée comme 
une stratégie mise en place dans le poéme pour se ménager une place dans l'histoire littéraire 
et dans la tradition exégétique. Mais si l’on inverse la perspective, on peut envisager que 
cette difficulté soit en fait au service du commentaire, lequel contribue au moins autant 
que le poéte à la forger et à la mettre en avant, et qu'elle permette de justifier la production 
massive d’exégèses à travers les siècles. Ce renversement apparaît de façon intéressante 
dans la superposition entre les différents personnages du poéme et les différents acteurs 
de la communication littéraire telle qu'elle est présentée, encore une fois, par Gérard 
Lambin : «Tel est le róle, humble et si important, du serviteur — le poéte — : ce cri, par 
lui reçu à la demande du “maître”, du “seigneur” (v. 3, 9 et 1467), il tâche de le traduire 
en mots que seul interprétera ce maitre, ce seigneur — le lecteur ou auditeur. *°» Le lecteur, 
l’interprète, et in fine le commentateur sont rois dans leur rapport aux mots obscurs 
que leur offre humblement le poète : la difficulté apparait alors comme la condition de 
l'exercice de leur pouvoir et, pourquoi pas, de leur propre créativité. 


4. CONCLUSION : RHÉTORIQUE DE LA DIFFICULTÉ ET CRÉATIVITÉ CRITIQUE 


À partir de l'hypothése selon laquelle la pratique du commentaire se fonde sur un double 
principe a priori contradictoire d'autorité et de difficulté, nous espérons avoir pu faire 
apparaitre, non pas les enjeux méthodologiques de ce paradoxe initial, mais certains de ses 
effets possibles dans les procédures métatextuelles engagées dans le genre de la critique 
savante. En d'autres termes, si nous ne prétendons encore une fois en aucun cas juger 


26. Lambin (2005 : 292). 
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nous-méme de la question de la légitimité de la critique et de ses méthodes, nous faisons 
l'hypothése que cette question fonde le commentaire, et fait émerger un certain nombre 
de traits d'écriture qui lui sont en partie spécifiques. Le concept d'autométatextualisation, 
emprunté à Florian Pennanech et mis en rapport avec la notion de difficulté, permet de 
décrire le fonctionnement d'un ensemble d'opérations critiques plus ou moins fréquentes, 
pour en montrer ensuite la productivité du point de vue de la rhétorique déployée dans le 
commentaire. Si l'étude de l'autométatextualisation de la difficulté peut donc apparaitre 
comme inutilement technique et spécialisée au premier abord, elle présente malgré tout 
l'intérét de montrer que les paradoxes et les questions qui traversent l'écriture critique 
donnent lieu à la mise en place de dispositifs ingénieux dont il n'est peut-étre pas inutile 
de dresser l'inventaire — non pas pour disqualifier les commentaires, mais au contraire pour 
comprendre comment ils s'écrivent. Le présent travail souscrit dés lors lui aussi, peut-étre 
paradoxalement, mais sans réserve à l'idée que les pratiques discursives apparemment 
les plus simples et les plus transparentes, comme celles qui caractérisent le commentaire, 
sont le fruit de procédés complexes qui sont dignes d’être étudiés, éventuellement pour 
être maitrisés : la difficulté apparait donc bien à tous égards comme un puissant moteur 
pour la création littéraire, y compris au deuxième ou au troisième degré. 
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NOMS DE PEUPLES - CALQUE, TRADUCTION, CRÉATION 


Alain CHRISTOL 


Les Huns, piquant des deux, arrivérent à Troyes quatre à quatre. 
(Raymond Queneau) 


RÉSUMÉ 


Parmi les noms propres, les ethnonymes se distinguent par la nature de leurs référents, qui sont des 
collectivités humaines et non des individus. Le présent article étudie la maniére dont les ethnonymes 
sont choisis par les locuteurs et la place qu'ils prennent dans l'imaginaire, en fonction de leur 
référent mais aussi des interférences phonétiques et/ou sémantiques qui se créent avec des appellatifs. 


ABSTRACT 


Among proper nouns, ethnonyms have a specific feature: they designate a group of human beings, 
with moving borders from a geographical as well as a historical point of view. The present paper 
deals with the names peoples give themselves or are given by neighbours. An ethnonym may be 
borrowed, translated or created, starting from what is supposed to be a distinctive feature, as food, 
clothes or hair dressing. 


1. ENTRE DÉSIGNATION ET SIGNIFICATION 


1.1. D'un et le multiple 


Un nom propre (NP) sert à désigner, c'est-à-dire à distinguer un élément parmi tous ceux 
qui appartiennent au méme ensemble; a priori 1l n'a pas d'autre fonction et, en principe, 
est vide de sens '. Cela rend difficile la quête étymologique car on travaille sur la seule 
articulation phonétique, sans le contróle de la sémantique. 

Un ethnonyme a les caractéristiques d'un NP puisqu'il est choisi pour désigner un élément 
à l'intérieur de l'ensemble des ethnies. Mais il en différe par la nature de ce qu'il désigne : 
une ethnie est une réalité complexe aux frontières fluctuantes dans l'espace comme dans le 
temps. C'est une collectivité d'étres humains ; on peut y relever des traits communs et donc 
des stéréotypes, comme «les Suédoises sont blondes », ou des emplois génériques, comme 
«le Francais boit du vin», vérités d'expérience fondées sur une perception statistique. Ces 
propriétés, nées de la multiplicité, rapprochent l'ethnonyme du nom commun. 


1.2. Peuple, langue, territoire 


L'affaire se complique quand on voit les liens qui se tissent entre langues et peuples ou 
entre territoires et peuples. On a ainsi trois grilles de classement pour les humains, grilles 
qui ne coincident que trés partiellement. La politique joue souvent un róle important 


1. Pour les problèmes linguistiques posés par les noms propres, on renvoie à Leroy (2004) et Leroy 
et Muni Toke (2007). 
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dans la création et la vie d'un ethnonyme; l'autorité centrale, rejointe sur ce point par 
les linguistes ou les ethnologues, impose des frontières nettes, entre les composantes 
ethniques comme entre les langues : 


(1) Notre objectif [...] sera de montrer que la nomination des langues, comme celle des 
communautés, résulte d'une construction sociale, d'une volonté d'homogénéisation, 
notamment pour deux catégories de «donneurs de noms», les institutions (État, Justice, 
Église, etc.) et les linguistes, alors méme qu'elle est pratiquée de maniére beaucoup plus 
hétérogène et variante par les locuteurs, en fonction des situations. (Canut 2001 : 443) 


L'État peut mettre en cause une identité nationale en niant l'existence d'un peuple, comme 
la Turquie pour les Kurdes. Il arrive aussi que soit décidée en haut lieu la scission admi- 
nistrative d'un peuple, comme pour les Balkars et les Karachais, voisins turcophones 
du Caucase?. 

Les Slovènes ont aujourd'hui un ethnique (Slovenec), une langue (Slovenščina) et 
un pays (Slovenija) mais pendant des siècles, en l'absence d'autonomie politique et de 
reconnaissance officielle, plusieurs désignations étaient en concurrence ; le titre que 
A. Eržen? a donné à son article : «Sclavi, Slaves, Slovenes, Illyriens ou Vindi, Wenden, 
Veneti? » montre bien ce flottement onomastique ; n'ayant pas de nom, ce peuple n'existait 
pas pour les autres. À l'inverse, les Serbes et les Croates, qu'on a tenté de réunir dans 
un méme État, la Yougoslavie, ont refusé cette unité et insistent sur leurs différences 
linguistiques alors qu'il y a intercompréhension et qu'ils ont une méme grammaire et un 
méme lexique fondamental. 

L'histoire a fait que les Wallons de Belgique, les Suisses romands et les Français, bien 
qu'ils parlent une méme langue, appartiennent officiellement à trois nations distinctes. 
La Suisse tire son nom du canton germanophone de Schwyz, les Belges du peuple celte 
des Belgae, ressuscité lors de la séparation avec les Pays-Bas. Seule l’histoire permet de 
comprendre le choix, politique, de ces ethnonymes. 


2. CHOIX D'UN ETHNONYME 


Ces remarques liminaires posent la question des critéres qui interviennent dans le choix 
d'un ethnonyme. Le premier constat est l'existence d'une double matrice dérivationnelle, 
/Peuple => Territoire/ (Russe => Russie) et /Territoire => Peuple/ (Italie => Italien), 
manifestation lexicale du vieux conflit entre droit du sang et droit du sol ou, de facon 
plus concréte, projection de la genése ethnique sur le lexique. 

Ensuite, si on regarde le nom que donnent les voisins, on reléve parfois des variantes 
multiples qui ne peuvent se justifier par de simples adaptations phonétiques. Un exemple 
frappant est celui des Allemands. Alors que les langues d'Europe ont pour les Francais 
une désignation issue de la base *Frank*, les voisins des Allemands (autoethnonyme 
Deutsch) utilisent des ethnonymes variés : Tedesco (italien), Allemand (français), German 
(anglais), Niemiec (polonais), Saksa (finnois), Vokietis (lituanien), etc. Et Germani, leur 
désignation antique, semble leur avoir été donnée par les Romains à partir d'ethnonymes 
périphériques. Cette variété doit inciter à la prudence dans l'étude des ethnonymes 


2. Ces deux peuples sont voisins et parlent la méme langue, puisqu'il a été possible de rédiger un 
dictionnaire commun. Pour les relations entre ethnies et découpage administratif en URSS, voir 
Charachidze (1989). 


3. Eržen (2009). 
. Sauf en grec moderne, où se conserve le nom antique des Gaulois. 
5. Loicq (2007 : 68-69) 
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antiques; la multiplicité des sources, mal identifiées, fait qu'un auteur a pu enregistrer 
des désignations concurrentes comme représentant des ethnies distinctes. 


2.1. Autoethnonymes 


Les noms que se donnent les peuples sont parfois d'une grande banalité : «les Hommes» 
(Inuit, Mansi, etc.) ou, avec valeur déictique, «les Nótres». Mais le plus souvent le 
nom est hérité des ancétres et immotivé pour ceux qui le portent. Le nom utilisé dans 
la langue source peut être adopté par la langue cible; c’est le cas en particulier pour les 
peuples lointains, que les explorateurs ou les ethnologues ont fait connaitre au grand 
public, sans contact direct. 

Mais cela vaut aussi pour des peuples plus proches, avec parfois des tentatives de 
francisation phonétique. Les Bulgares s'appelaient ainsi avant leur arrivée dans les Balkans 
et ont gardé ce nom, malgré la disparition de leur langue d'origine. La forme médiévale 
Bougre’, adaptée à la phonétique du français, a été réservée aux hérétiques des Balkans 
(Bogomiles) et, devenue un appellatif, s'est chargée de toutes les connotations péjoratives 
qui s'attachent aux hérésies. Le lien sémantique avec l'ethnonyme s'est perdu. Il en va 
de méme pour les Croates : Croate est la forme allemande de l'autoethnonyme (moderne 
Hrvat ; grec médiéval XpwBätor) ; la forme francisée Cravate ne survit que dans le nom 
d'un ornement vestimentaire *. 


2.2. Noms donnés par des voisins 


Certains peuples ont été connus indirectement, par l'intermédiaire de leurs voisins, et 
l'ethnonyme que nous utilisons n'est pas l'autoethnonyme. Onoguroi (fr. Hongrois, all. 
Ungarn, etc.) est le nom qu'on a donné en Europe à ceux qui s'appellent Magyar”. 
Les Lapons (autoethnonyme saami) seraient des «loqueteux » ; Eskimo (autoethnonyme 
Inuit), d'origine incertaine (« mangeur de viande crue» ?), est rejeté comme péjoratif par 
ceux que les étrangers appellent ainsi. Les Hurons (autoethnonyme Ouendat) devaient 
leur nom français à leur chapeau en forme de hure de sanglier. Les Tchétchènes et les 
Ingouches doivent leurs noms aux Russes qui les ont dérivés de deux bourgades, Sasan 
et Angust. Leurs autoethnonymes sont respectivement Naxtsi et Ghalghai?. 


2.3. Emprunt ou traduction ? 


Quand l'ethnonyme a un sens dans la langue-source, il arrive qu'il soit traduit mais les 
critéres du choix entre emprunt et traduction restent obscurs. 


6. Suebi, Sabini, etc. : Bader (2004 : 61-64). Si nommer son propre peuple «les Nôtres» est 
vraisemblable, il est plus difficile de délimiter l'extension de cette matrice lexicale. On partagera 
les doutes de D. Petit (1999 : 308). 
Mesnil Popova (1993 : § 9). 

8. lla existé, dans l'armée française, un régiment nommé le Royal Cravate, fondé au xvir siècle et 
composé de soldats venus de Croatie. 

9. Onogur est un mot turc, dont le sens pourrait être «les dix (on) tribus ». Constantin Porphyrogénète 
appelle les Hongrois Todpkot « Turcs». 


10. Tsaroieva (2008 : 33-35). Ghalghaï pourrait continuer le nom des l'apyapeig que cite Strabon (11, 5, 1), 
dans l'actuel Daghestan. 
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2.3.1. « Barbes longues» 


Le système pileux est ambigu ; il est négatif pour les Barbares ou les marginaux hirsutes ; 
1l est positif et signe de virilité pour les gens civilisés : 
(2) Une autre maniére de marquer la distance avec l'étranger, c'est d'en souligner la pilosité 
«animale» : celle-ci s'oppose alors au poil discipliné par le barbier, cet agent civilisateur 


de prime importance : armé de son rasoir, c'est lui qui fait «rentrer dans l'ordre les poilus, 
velus, hirsutes et autres mal rasés» !!. 


L'Antiquité a connu des peuples (sur) nommés «Les Longues Barbes». Langobardi", 
en version originale, est le nom d'un peuple germanique, plus connu sous le nom de 
Lombards. En traduction, on citera le peuple scythique des Maxponmywvec ”. 


2.3.2. «Manteaux noirs» 


Même dualité pour les «Manteaux noirs» : Hérodote ' mentionne les MeAdyyAatvor 
parmi les voisins des Scythes, composé grec dont le second terme est yAaiva «manteau » 
et qui peut traduire un original scythique. 

Le décret d'Olbia en l'honneur de Protogène ^ donne la liste des tribus scythiques 
qui menacerent la ville; il y est fait mention des ZAYAAPATAI, inconnus par ailleurs. 
Ce nom pourrait signifier «qui portent un (vêtement) noir» '°. 

Lovpopdtat, nom d'une ethnie scythique connue depuis Hérodote, avait probablement 
un sens proche : sau- «noir» + *ruma- «poil» avec le suffixe du pluriel scythique *-ta (oss. 
-tæ) "7. Mais ce n'est pas la seule étymologie possible '* et le probléme se complique si on fait 
intervenir les Xapuácat mentionnés à partir de Polybe, et les Zvpuütou installés sur les bords 
du Don ?; leurs noms pourraient être des formes dialectales ou évoluées de Xavpopatat”. 

De ces traductions motivées il faut distinguer les paronomases, où un nom étranger 
est identifié à un lexéme de la langue cible, avec lequel il n'a, au départ, aucun lien 
sémantique (voir section 3). 


2.4. Permanence d’un ethnonyme 


Un autre trait des ethnonymes est la persistance de désignations associées à un territoire 
ou un mode de vie, méme quand la composition ethnique a changé. Pour les Grecs de 


11. Mesnil Popova (1993 : § 11). En argot, un gonze poilu est un gars costaud, viril, comme les Poilus 
de 1914. Va dans le méme sens la moustache longtemps imposée aux gendarmes. 


12. Tacite, Germ. 40; Isidore de Séville connait le sens de Langobardus (etym. 2, 9, 95) : Langobardos 
vulgo fertur nominatos prolixa barba et numquam tonsa, « On dit communément que les Lombards 
sont ainsi nommés parce qu'ils laissent pousser leur barbe et ne la coupent jamais ». 


13. Strabon 11, 2, 1. 
14. Her. 4, 20. 
15. m/m s. av. J.-C. : JOSPE (P : 32). 


16. On rapprochera osséte sau «noir» et daryn «tenir». Si dar- oriente vers un vétement, *ruma peut 
désigner aussi bien la couleur des cheveux que celle de la peau de mouton utilisée comme vétement. 


17. Her. 4, 21. 
18. Lebedinsky (2014 : 27-31). 
19. Périple de Scylax, 68. 


20. Counillon (2004 : 78) considére que les Syrmates sont distincts des Sauromates et des Sarmates, 
mais cela ne préjuge pas de l'étymologie. 
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l'Antiquité, tout nomade européen était un Scythe, méme aprés la disparition des Scythes 
comme ethnie (m° s. av. J.-C. ?), et Attila a pu être défini comme le «chef des Scythes »?!. 

Jordanés a intitulé Getica son ouvrage sur l’histoire des Goths, alors que les Gétes étaient 
une tribu thrace, disparue récemment. La proximité phonétique a facilité la confusion. Les 
Ossétes appellent Asy les Balkars, leurs voisins occidentaux de langue turque, parce que 
leur territoire était occupé jadis par la tribu scythique des As (slave Jas), tribu qui partit 
vers l'ouest au moment des invasions mongoles pour s'installer en Hongrie, ou ils ont 
laissé quelques traces linguistiques, sous le nom de Jász. Les Lituaniens appellent Gudija 
la Biélorussie (Belarus), parce que ce territoire fut jadis occupé par les Goths (Gudas). 

Autre exemple de permanence : l'ethnonyme d'un peuple dominant survit à la fusion 
de ce peuple dans un ensemble allogène, malgré la perte de sa langue originelle. Les 
Bulgares gardent le nom des tribus turques arrivées dans les Balkans au vir? s. ; mais 
les Bulgares turcophones se sont fondus dans la population locale dont ils ont adopté la 
langue slave. Les Francais, de langue romane, portent encore le nom des envahisseurs 
germaniques du nord du pays (Franci). Les Normands doivent leur nom aux « Hommes 
du nord», alors que les Vikings, minoritaires dans une population de langue romane, ont 
perdu leur langue et leur identité ethnique. 


2.5. Réactivation d'un ethnonyme 


À cóté de cette inertie lexicale, on a le recours volontaire à des ethnonymes sortis d'usage 
pour renforcer une construction politique, par exemple pour se donner des ancétres prestigieux 
ou pour étayer une revendication territoriale. 

Quand Napoléon annexe la cóte orientale de l'Adriatique (Dalmatie), il choisit pour 
ces nouvelles provinces l'adjectif « Illyriennes » (1809), ressuscitant le peuple antique des 
Illyriens, disparu depuis des siècles. Et ce nom a été repris, vers 1840, par le «Mouvement 
Illyrien» (ilirski pokret), qui voulait fédérer les Slaves du sud (Yougoslaves) pour mieux 
contrer les nationalismes allemand et hongrois. Le choix d'un ethnonyme antique permettait 
de transcender les rivalités entre ethnies slaves et d'affirmer une forme d'autochtonie. 

Les Macédoniens, de culture grecque”, ont conquis la Grèce et l'Asie avant de 
succomber aux assauts des Romains. Terre de conflit entre Slaves, Albanais, Byzantins puis 
Ottomans, la Macédoine est devenue un espace pluriethnique, dont le nom est revendiqué 
aujourd’hui pour une province par les Grecs et un état par les Slaves. 

«Nos ancêtres les Gaulois» est un bon exemple de résurgence d'un nom antique” ; 
l'autochtonie celtique des «vrais Frangais » permettait de rejeter dans la Barbarie d'outre- 
Rhin la composante germanique, revendiquée comme ancétre par la noblesse et devenue 
«l'ennemi héréditaire » aprés 1870; du méme coup l'impact de la colonisation romaine 
était minimisé. 


2.6. Nom d'une tribu étendu à un ensemble ethnique 


Le nom de la première tribu connue peut devenir générique en s’étendant aux tribus appa- 
rentées ; ce fut sans doute le cas, en latin, pour Graecus «Grec» ?^. Idovec/loves «ionien» 
a été emprunté par les Perses, avec un sens générique, yauna «Grec»; d’où le moyen-indien 


21. ActüjAag : ó t&v Xxó00v ryéuov (Suidas). 
22. Lalangue «macédonienne » antique n'est connue que par quelques gloses et semble avoir été assez 
différente du grec; elle n'a aucun descendant moderne. 


23. Reynaert (2010 : 21-32). La noblesse d'épée prétendait descendre de nobles Francs, de Clovis à 
Charlemagne. 


24. Fruyt (1987). 
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yona «Grec», attesté depuis les Edits d' ASoka, vers 260 av. J.-C., et le sanskrit yavana 
«peuple occidental». Le turc a encore Yunan «Grec» et Yunanistan «Grèce». 

Volcæ « Volques » a eu un destin remarquable par sa longévité et sa polysémie : 

(a) peuple celtique (César) : Volcae; 

(b) tout peuple occidental non germanique, Celtes puis Romans : Welsh, Wallons ; 

(c) pour les Slaves, peuples de langue romane : pol. włoch «Italien», d’où hongrois Olasz; 

(d) dans les Balkans, vlah (gr. BAayot) désigne des «éleveurs nomades (de langue 

romane)», les Valaques *. 

Alamani (Dion Cassius, Ammien, Claudien) : cette confédération germanique 
(*all-mann «tous les hommes» ?) est à l'origine du nom que les Français donnent aux 
peuples germaniques continentaux, les Allemands. 


2.7. Créations populaires 


La langue populaire crée volontiers des désignations nouvelles, plutôt péjoratives, pour 
les peuples voisins, avec lesquels les relations sont souvent tendues. Plusieurs procédés 
sont en concurrence : 

— modification de l’ethnonyme par suffixation postiche : Amerloques, Espingouins, 
Ruskoffs, Chinetoques ; 

— mots valises : al (lemand) + caboche ou boche «(tête de) bois» donne Al (le) 
boche (apparu vers 1860) et avec aphérése Boche ; 

— métaphore : Doryphores «Allemands» (voir section 4.1); 

— métonymie fondée sur un trait distinctif ou supposé tel, aliment : Rosbifs «Anglais », 
Macaronis «Italiens» (voir section 4.1); vétement : Mélanchlaines (voir section 
2.3.2), Hurons (voir section 2.2); prénom usuel : Fritz « Allemand» ; phrase 
fréquemment prononcée : Godons «Anglais» (God dam); 

— transfert onomastique : un ethnonyme désigne un autre peuple auquel on préte les 
mêmes mœurs, en général barbares. Chleuh, nom d'une tribu berbère du Maroc, 
a désigné aussi les Allemands. 


3. INTERFÉRENCES SÉMANTIQUES 


Une fois adopté, un NP peut être mis en relation avec des lexèmes de la langue cible, 
par simple proximité phonétique : parmi les chefs de guerre japonais, Yamamoto ne doit 
pas sa renommée en France à des exploits guerriers exceptionnels mais aux nombreux 
calembours que permettait son nom. Il en va de même pour les ethnonymes : si le locuteur 
l'estime pertinente, la proximité phonétique va créer un parasitage sémantique qui modifie 
la perception du NP et change sa valeur dans l’imaginaire des locuteurs. 


3.1. Les Huns et les Maures 


Parmi les peuples étrangers, anciens ou modernes, proches ou exotiques, on constate certains 
succès, inexplicables pour qui ferait abstraction des interférences phonético-sémantiques. 
Dans l’apprentissage de l’histoire, les enfants sont fascinés par des ethnonymes comme 
les Maures ou les Huns. Le combat des Maures, dans le Cid, était source de perplexité et 
de plaisanteries pour les élèves; tradition parfois reprise par des adultes : 


25. Devenu l’équivalent de mleccha «barbare» : Ray et Nolot (1993 : 456). 


26. De l'identité du pluriel Vlasi « Valaques » avec vlasi «cheveux » est née, chez les Bulgares, l'image 
des « Valaques velus », l’ethnonyme étant expliqué par l’appellatif (Mesnil Popova 1993 : § 30-32). 
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(3) Les Maures étant couchés, le Pacha leur lança : «Allons, debout les Maures ! »?7 Et tous 
se sont levés. Moralité : plus de Maures alités. (André Jouette, cité par Gagnière, 2002 : 148) 


Le nom des Huns, bien mal adapté à leur statut de barbares monstrueux et sanguinaires, 
est une source inépuisable de jeux de mots : 


(4) Les Huns, piquant des deux, arrivèrent à Troyes quatre à quatre. (Raymond Queneau, 
Les Œuvres complètes de Sally Mara, Paris : Gallimard, 1962 : 347) 


(5) Lorsque les Huns s’en vont combattre, / Marchent-ils par deux ou par quatre? / Non, 
ils marchent par rangs de un, / Par rangs de un marchent les Huns. (Pierre Henri Cami, 
Marche des Huns)?* 


3.2. Peuples antiques 


L'Antiquité a connu ces interférences, qui permettent de créer une auréole sémantique autour 
d'un ethnonyme, auréole le plus souvent péjorative, comme pour les habitants de Chios chez 
Aristophane ”. On citera l'exemple bien connu des Perses ®. Hépong « Perse» (vx p. Parsa) 
a été rattaché à la racine de nép0o «détruire», jugée pertinente pour ces envahisseurs venus 
d'Orient. IHepo£noAuc, capitale des Perses, était homonyme de mepoénoAtc «destructeur de 
villes» et Eschyle emploie le verbe nép0o à propos des Perses : 


(6) (EépEnc) Taóvov yv otyevat népoar 0£Xv. (Eschyle, Perses 178) 
« (Xerxes) marche vers la terre des Ioniens, avec l'intention de la détruire.» 


Il est vrai que IIépong était déjà péjoratif avant l’irruption des Perses dans le monde 
égéen : c'est le nom du mauvais frére d'Hésiode, nom réel ou sobriquet « Le Ruineur». 


3.3. Qui sont les Spores ? 


Parmi les ethnonymes antiques, l'hapax Xzópo attesté chez Procope, mérite une attention 
particulière; c'est un bon exemple des problèmes que pose l'onomastique antique. 
(7) Enópovg yàp Tò TAAMLOV åupotépovg Ékékovv, STL di] oropáðnv, Oia, ó:oknvnu£vot 
Tv xópav oikodor. (Procope 7, 14, 29) 
«On nommait jadis Sporoi ces deux peuples (Antes et Sclavénes), à mon avis parce qu'ils 
avaient un habitat dispersé sur ce territoire.» 


Tout incite à penser qu'il s'agit d'une étymologie populaire, mais aucune autre source ne 
vient confirmer la forme de Procope. Jordanes*! mentionne les Spaloi mais sans autre 
précision ; Sporoi pourrait en étre une adaptation paraétymologique mais rien ne permet 
d'affirmer l'identité de ces deux peuples. 

F. Cornillot a proposé une étymologie fondée sur un nom nord-iranien de la charrue ? ; 
les Sporoi seraient des «gens de la charrue», donc des laboureurs. On reste à proximité 
des semailles et des Scythes l'eopyot. Mais il faut rappeler que l'épithéte « Cultivateurs » 


27. Echo de la phrase célèbre : «Debout les morts ! » (prêtée à l'adjudant Péricard, Verdun, 1915). 


28. Pierre Henri Cami, Voyage inouï de Monsieur Rikiki, 1938 (rééd. J. J. Pauvert — Ramsay, 1989). 
M. Rikiki, inventeur de l'écrevisse à remonter le temps, rencontre les Huns et leurs adversaires, 
les Dheux. 


29. Ar, Pax 171. 


30. Sur cette interprétation du nom des Perses : de Lamberterie (2016 : 66); pour l'étymologie 
iranienne : Pirart (1995); repoén (1) ol : Esch., Perses 65; Ar., Nub. 967 (chant traditionnel). 


3]. Getica 28. 
32. Cornillot (1981 : 36), où sont citées des formes iraniennes orientales (Pamir) comme yidgha sporo, etc. 
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(Hér., 4, 18) pourrait être, selon V. I. Abaev ?, l'hellénisation d'une forme iranienne *gau- 
warga «qui honore la vache», mot qui n'avait rien à voir avec l'agriculture. Si Apotijpsc*, 
« Laboureurs », peut être une forme secondaire, simple glose de l'eopyoí, cet ethnonyme 
peut provenir d'une source indépendante, affirmant la présence de Scythes sédentaires. 

À titre d'hypothése, on proposera de voir dans Sporoi une traduction éphémére de 
Germani, rapproché de germen « graine » 5. 


3.4. Coincidence partielle 


3.4.1. Lexémes gigognes 


Le locuteur remarque parfois, à l'intérieur d'un mot, une séquence phonétique qu'il 
rapproche d'un autre lexéme. On entend ainsi : «comme son nom l'indique, Isabelle est 
belle» ou «champion ca rime avec pognon», phrases qui montrent que les locuteurs n'ont 
pas renoncé à établir un lien entre phonétique et sémantique ; la formule «ca rime avec» 
n'est pas seulement métalinguistique, elle suggère une affinité sémantique. 

Alphonse Allais avait relevé ce phénoméne, en le poussant à l'absurde selon sa méthode 
favorite : 


(8) Ce n'est pas parce que les Malais sont laids, les Portugais gais, les Colombiens biens, 
que les Espagnols sont gnols. (https://dicocitations.lemonde.fr/citations/citation-47598.php) 


3.4.2. Pseudosuffixes 


Un (pseudo) suffixe peut orienter l'appréciation que les locuteurs portent sur les peuples ; 
Ostrogoth, nom antique d'un peuple germanique *, entre dans une série dépréciative, 
celle de saligot, mendigot, Parigot, etc., ce qui a fait son succès en français familier : 


(9) Je voudrais étre admiré... de mon blanchisseur, un Ostrogoth qui me rend mes 
chemises en loques... (G. Fourest 1964 : 106) 


(10) Les croquants, ca les attriste, ca les étonne, les étonne 

Qu'une fille, une fille belle comme ça, s'abandonne, s'abandonne 

Au premier Ostrogoth venu. Les croquants, ca tombe des nues. (G. Brassens, «Les 
Croquants », 1955) 


À l'inverse, pour Huron (section 2.2), la proximité phonétique de ahuri ou de luron et 
le suffixe hypocoristique -on, suggèrent un être naïf et sympathique, et c’est bien ainsi que 
Voltaire présente son personnage dans L’/ngénu. Lapon, avec le méme suffixe, désigne 
un peuple a priori sympathique ; ce que confirme G. Fourest : 


(11) Les braves petits Lapons / boivent l'huile de poisson. (G. Fourest 1909, 1964 : 54) 


L'adjectif petit et l'huile de poisson orientaient les lecteurs vers l'enfance et l'huile de 
foie de morue qu'on donnait aux jeunes comme fortifiant. 


33. Abaev (1981); Lebedinsky (2001 : 34). 
34. Hér., 4, 17. 


35. L’étymologie de Germani est inconnue et la proximité phonétique de germanus «vrai, authentique » 
peut être accidentelle : Loicq (2007 : 69). 


36. Lechoix d'Ostrogoth, au détriment de Wisigoth, tient probablement à la sonorité plus expressive du 
premier et n'a pas à étre recherché dans le comportement de deux peuples que l'histoire populaire 
tient pour égaux en barbarie. 
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3.4.3. Les Papous 


Les Papous méritent une mention spéciale ; leur nom, emprunté au Malais, contient les 
lexémes papa et pou, ainsi que le (pseudo) suffixe hypocoristique -ou. L’exotisme de 
ce peuple aux moeurs inquiétantes, dans une jungle impénétrable, aurait dà rendre son 
nom inquiétant. La phonétique s'y oppose et Papou, perçu comme peu sérieux, est une 
source de calembours. 


(12) Donc chez les Papous, y a des Papous papas à poux, des Papous papas pas à poux... 
(Franquin, Des gaffes et des dégáts, Marcinelle — Charleroi, Dupuis, 1977 : 54) 


4. TYPOLOGIE DES PEUPLES — L'ALIMENTATION 


4.1. L'aliment comme trait distinctif 


La désignation de l'étranger se fait parfois par référence à sa nourriture habituelle, ou 
supposée telle : Rosbifs, Macaronis, etc. (section 2.7). A fortiori quand il s'agit d'aliments 
interdits ou répugnants pour ceux qui créent le nom, comme l'anglais Froggies « (Frangais) 
mangeurs de grenouilles ». Peut-être aussi russe Samoyéde «cannibale» ?". 

Un peuple peut étre désigné par le nom d'un animal qui a la méme nourriture : 
les Allemands, grands consommateurs de pommes de terre, seront des Doryphores parce 
que cet insecte se nourrit des plants de pommes de terre. 


4.2. Typologie antique 


Dans les dénominations antiques, on peut établir une échelle dans l'alimentation, qui va 
des désignations objectives, neutres, aux dénominations nettement péjoratives : 

— Ichthyophages, «mangeurs de poisson» : peuple du golfe Persique, vivant sur les 
rivages arides de la Gédrosie, là où le poisson est la seule nourriture accessible 
et sert méme pour le bétail. Cette désignation est purement descriptive. Aucun 
Grec ne peut considérer le poisson comme une nourriture étrange ; l'anomalie est 
dans l'exclusivité. 

— Galaktophages, «mangeurs de produits laitiers», est une épithète des Scythes ; la 
tradition est ancienne, puisqu’Homere cite les yAakvooáyoi; Strabon mentionne 
le méme régime pour les Mysiens, qui s'abstiennent de viande ?. Comportement 
plutót positif, à la confluence de la vie pastorale et de l'enfance. Mais le lait est 
aussi la boisson de Polyphéme, l'anthropophage, et les Barbares buveurs de lait 
en sont restés au stade de l'enfance?^'; le statut de ces peuples reste ambigu. 

— Strouthophages, «mangeurs d'autruche», et Eléphantophages, «mangeurs 
d'éléphants » : tribus citées par Strabon dans la description du royaume de Méroé“!. 
Il s'agit d'un régime alimentaire adapté au contexte écologique, comportement 
«exotique» mais non condamnable en lui-même ?. 


37. Mesnil Popova (1993 : § 3). 

38. Arrien, /ndiké 26, 2; Strabon cite des /chthyophages en Arabie (16, 4, 7). 

39. Toakaxtopéyou: Strabon 7, 4, 6; yAaxtopayou: Hom., /]. 13, 6; Mysiens : Strabon 7, 3, 3. 
40. Auberger (2001 : 137-141). 

4]. Strabon 16, 4, 10-11. 


42. L'autruche apparait dans le menu des (riches) Romains, voir Apicius 6, 1, 1 (n° 210) : /n strutione 
elixo... «(sauce) pour l'autruche bouillie ». 
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— Androphages, «mangeurs d'hommes» ?; le cannibalisme est absent du monde 
grec et symbole de sauvagerie, méme parmi les Barbares. Il ne s'agit plus 
seulement d'une alimentation originale; il s'ajoute un jugement de valeur négatif 
sur des peuples infréquentables. 


4.3. Naissance d’un ethnonyme 


Phtheirophages «mangeurs de poux » ne peut relever d'une typologie des peuples fondée 
sur leur nourriture, car aucun peuple ne se nourrit de poux“. En fait, cet ethnonyme n'en 
était pas un au départ; il a été créé par étapes : 
(13) Oi uèv yàp Bovóivot &óvtec adtOyYOovEs vouáósc TE siot kai PDEIPOTPAYEOVOL uobvot 
TOV TavTH. (Hérodote 4, 109) 
«Les Boudins, autochtones, sont nomades et sont les seuls a croquer des / leurs poux dans 
le pays.» 
(14) "Ivanep dei £0voc XkvOióv od uvńunv Torito [...] Hpddsotoc. Kai Aéyet tobtovs 
siva Tod gOeipotpoxt£ovrac. (Arrien, Périple § 27) 
«Là ou habitait un peuple scythique que mentionne Hérodote. Il dit que ce sont eux les 
croqueurs de poux 9.» 


(15) ... Kepkéto te kai Maxpontmyaves : ónépketrat è TOUTOV koi Tà TOV POapopéyov 
otevé. (Strabon 11, 2, 1) 

«... les Kerketes et les Longues Barbes. Et au-dessus d'eux, les vallées étroites des 
Phtheirophages.» 


Comme il ressort de ces citations, l'ethnonyme d0zipogóéyot apparaît tardivement (Strabon); 
il a été créé a partir d'une description d' Hérodote. Mais chez cet auteur, il s'agit d'un 
trait contrastif et non d'un ethnonyme. 


5. TYPOLOGIE DES PEUPLES — LA COULEUR 


On a vu précédemment des peuples distingués par leurs vétements noirs (section 2.3). 
En face, on ales peuples «blancs » ou «brillants », comme les Roxolans «Alains brillants » 
(oss. ruxs «lumière ») ou les Aopoot «Blancs» (oss. urs «blanc»)*. Mais la symétrie est 
peut-étre illusoire car il n'est pas fait mention de vétements pour les peuples « blancs». 
L'opposition entre « Noirs » et « Blancs» pourrait donc se situer à un autre niveau, 
la situation dans l’espace ou la hiérarchie sociale’. 


5.1. Nord vs sud 


En Asie centrale, l'opposition entre nord et sud se fait sur une base chromatique, le nord 
«noir» s'oppose au sud «blanc»; ce contraste se conserve en turc oü Kara deniz « Mer 


43. Her. 4, 18; 4, 100. 


44. Dans la description qu'il fait des peuples turcophones rencontrés sur la route qui va du Khorassan 
à la Volga, Ibn Fadlân (x° s.) évoque cette coutume de manger ses poux (1983 : 30). 


45. Il s'agit de la ville de Nitiké, au sud de Pityous (aujourd'hui Pitsunda). Chez certains peuples, 
l'épouillage est un acte social et on peut tuer les poux d'un coup de dents; le glissement de 
«croquer» à «manger » se fonde sur une interprétation malveillante d'un geste social et hygiénique. 


46. Strabon11,5,8. Voir Lebedinsky (2000: 11). Oss. urs «blanc» est issu de i.-ir. *arusa- «incandescent». 


47. L'opposition entre Noirs et Blancs est largement attestée dans les ethnonymes de l'Europe orientale : 
Ludat (1953 : 142-144). 
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noire = Pont-Euxin » s'oppose à Ak deniz «Mer blanche = Méditerranée » ‘8. À l'intérieur 
d'une ethnie, les tribus nordiques seront «noires », sans valeur péjorative au départ. 
Ensuite, dans les mouvements de population, les épithétes accompagnent leurs porteurs 
et perdent leur pertinence spatiale. 


5.2. Contraste social 


Chez les Turcs, la société des hommes libres se partage entre les nobles, les «beys blancs», 
et les éleveurs ou agriculteurs, les hommes «noirs (gara)». Un peuple «noir» sera donc un 
peuple qui a perdu sa liberté et vit dans la misére et le brigandage, donc un peuple dangereux 
et/ou méprisable^. Le Caucase a connu la valeur sociale de la couleur noire; on a par exemple 
ossète saulæg «homme noir = esclave» ou azéri qarabas (bas «téte») «esclave, servante» ?. 


6. DES SAUTERELLES ET DES HOMMES 


Parmi les populations des rivages caucasiens de la mer Noire*!, sont cités les Bpodyot, 

voisins immédiats des ABaoyoi. Les Bpodyot occupent le territoire qui sera celui des Oubykh 

et pourraient étre leurs ancétres, comme les ABaoyoi sont ceux des Abaza (installés depuis 

au nord du Caucase) et les Aya” ceux des Abkhaz, qui se nomment encore aujourd’hui 

a-ps-wa. En grec, Bpotyoc signifie «sauterelle» et Hésychius cite des formes comparables. 
Un autre peuple, dans la même région, retient l'attention, les Kepkétor* : 


(16) Metà 6& Livducdv 2ipéva. Kepkécvoi tor Topétar Ovog. 
«Après le lac Sindique, (on trouve) le peuple des Kerkétes ou Torètes. » 


et chez Hésychius, mais comme peuple indien : 
(17) Kepxétan * £üvog ivótóv. 


Il faut probablement corriger ivótkóv «indien» en otvótkóv «du pays des Sindes » (région 
du Kouban) pour, au moins, deux raisons : les sources antiques ne connaissent pas de 
peuple ainsi nommé en Inde alors que les Sindes du Caucase sont mentionnés comme 
voisins des Kerketes (voir n. 54). Si ce nom a le suffixe «scythique » de pluriel *-ta (oss. 
-tæ), la base *kerka pourrait signifier également «sauterelle », d’après une glose d'Hésychius, 
donnée malheureusement sans origine ethnique, képka * àkpíc («sauterelle »). 

Hécatée (vers 500 av. J.-C.) cite l'ethnonyme Martôketou, qui a été rapproché de 
l'iranien *ma@uka «sauterelle» (oss. metyx). 


48. De Planhol (1967 : 107). Pour les noms antiques du Pont-Euxin : Brust (2008 : 83-89); il n'est pas 
certain que les Scythes ou les Perses aient connu ce róle spatial des couleurs. 

49. Vaillant (1959 : 17); de Planhol (1967 : 107-108); Christol (1999). La symbolique sociale du blanc 
et du noir chez les Turcs ne peut guére s'expliquer directement, comme le propose X. de Planhol 
(1967 : 111), par celle des yourtes, blanches quand elles sont neuves, noires quand le feutre est 
vieilli et rapiécé. Le fait concret a pu étre réinterprété en symbole, cristallisant une opposition 
latente entre blanc bénéfique et noir maléfique. 

50. Pour les langues du Daghestan (avar, lak, lezgi, etc.), voir Djidalaev (1990 : 138). 

51. Cette section emprunte les données à Christol (1987 : 218-221) et (2008 : 329-333 et 338). 

52. Procope 8, 4, 1 (Bpodyot); 8, 2, 33 (ABaoyoi); 8, 3,12 (Ayo). 

53. LXX, Lev. 11, 22, dans une liste d'animaux comestibles ; il existe une variante sans aspirée chez 
Théophraste (Fg. 174.4); voir DELG 1142. 

54. Kepkéton : Pseudo-Scylax, Périple du Pont-Euxin § 73 (Counillon 2004 : 38-39); Périple anonyme 
IL, § 22 et 24 (Baschmakoff 1948 : 138); Strabon 11, 2, 1. Les Sindes, voisins des Kerketes selon 
les Périples, sont mentionnés par Hérodote (4, 28) comme habitant la rive orientale de la mer 
d'Azov, où Strabon (11, 2, 1) situe la Lwduch. 
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Une glose du méme Hésychius, àótyóp : tpogaAAic, dnd XkvO@v pourrait avoir un lien 
avec les Agur, vaincus par les Nartes et dont les survivants furent transformés en sauterelles”. 

De telles dénominations pour un ensemble de peuples peuvent étre : 

(a) une traduction grecque de noms indigènes (Matv«etat) ; 

(b) une déformation phonétique volontaire pour resémantiser ces mémes noms — mais 
un tel accident est individuel et peut difficilement expliquer l'ensemble —; 

(c) la désignation, par métaphore expressive, de montagnards pillards, redoutés des 
cités côtières et dont la mobilité et les incursions dévastatrices évoquaient celles 
des sauterelles. 

L'hypothése (c) peut s'appuyer sur une donnée locale : le Caucase était un lieu de 
reproduction des sauterelles, ce qui explique l'abondance des acridés dans le Caucase et 
leur place dans la religion; chez les Tcherkesses, le dieu des céréales est représenté sous 
la forme d'une sauterelle?*, Il ne serait pas surprenant, dans une telle situation, que les 
cités grecques, menacées alternativement par les incursions de pillards et par les nuées 
de sauterelles descendues des montagnes, aient désigné d'un même nom les deux fléaux. 


7. HOMONYMIE : ORIGINE COMMUNE OU HASARD PHONÉTIQUE ? 


Des noms de peuples éloignés dans l'espace et/ou le temps peuvent étre proches phonéti- 
quement. La tentation est grande pour les historiens et les linguistes d'utiliser ces similitudes 
pour reconstruire la préhistoire de langues et de peuples mal documentés. 


7.1. Les deux Ibéries 


Les Anciens connaissaient deux /béries, celle d'occident, en Hispanie, et celle d'orient, 
dans le Caucase. La similitude onomastique, avec la proximité de quelques toponymes, 
comme les hydronymes Aragon en Espagne et Aragvi en Géorgie, a été l'argument de 
départ pour le rapprochement entre basque et langues du Caucase?". L'hypothése en 
elle-méme est plausible mais comparer des langues dont la séparation remonte à plus de 
4000 ans est une entreprise d'autant plus difficile qu'une origine commune pour les trois 
familles caucasiques est loin d'étre prouvée. 


7.2. Les Vénètes ou Il n'y a pas de fumée sans feu 


À l'époque romaine, il existait au moins trois peuples nommés Vénètes 5 : 
— les Vénètes d'Italie, qui parlaient une langue proche du latin et ont donné leur nom 
à la Vénétie ; 
— les Vénètes de Gaule, dont le nom se perpétue dans celui de la ville de Vannes; 
— les Vénètes de Germanie orientale, dans lesquels on voit les ancêtres des Slaves. 


On y ajoute les Evetoi, peuple connu d' Homére et disparu à l'époque classique. Pour les 
Anciens, ces Énètes avaient quitté l'Asie Mineure après la guerre de Troie, pour partir 
s'installer au fond de l'Adriatique ?. 


55. Dumézil (1978 : 356). 
56. Charachidzé et Eseng (1991 : 36-40). 


57. On trouvera une bonne présentation de la «théorie caucasienne» des origines du basque chez 
Morvan (1996 : 53-81). 


58. Bader (2004 : 67-70), (2009), Loicq (2003), Flobert (2012), Weiss (2018). Vénètes de Gaule : Cés., 
BG 3,9; de Germanie : Tac., Germ. 46. 


59. Hom., 11. 2, 852 ; Strabon 12, 3,8. 
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Récemment, M. Weiss a remis ce lien en question, en montrant que chez Homere il 
s'agit d'un toponyme plutót que d'un ethnique 9. 

La question est posée de la valeur historique de cette identité onomastique. On rencontre 
ici un probléme universel, celui de la frontière entre l'homonymie et la polysémie et si, 
selon l'expérience, il n'y a pas de fumée sans feu, pour beaucoup de locuteurs similitude 
formelle implique proximité sémantique ; il ne reste plus qu'à en découvrir la nature. 
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ELEMENTS POUR UN COURS DE CRITIQUE TEXTUELLE : 
L'EXEMPLE DU GREC ANCIEN 


Victor GYSEMBERGH 


RÉSUMÉ 
Cet article s'efforce de montrer qu'il est facile de s'approprier et de transmettre aux étudiants un 
instrumentaire qui leur sera utile pour diverses activités intellectuelles et de lecture. Il contient des 


orientations bibliographiques, quelques principes généraux, et l'indication de quelques exercices 
inspirés de la session CLELIA 2018. 


ABSTRACT 


This paper aims to show that it is easy to acquire and to pass on to students a toolbox that will be 
of use to them in various intellectual endeavors and types of reading. It includes bibliographical 
pointers, general principles and exercises inspired by the 2018 CLELIA session. 


1. INTRODUCTION 


Qu'est-ce que la critique des textes? C'est l'effort visant à restaurer le texte, partout oü 
on le soupçonne d’être fautif. Dans le cas des textes anciens, ce soupçon est fréquent. 
A chaque fois que les manuscrits divergent, il faut choisir la leçon juste ou en conjecturer 
une autre. Méme quand tous les témoins concordent, on peut parfois démontrer, et on 
doit parfois soupconner que le texte transmis unanimement est fautif. Pour se convaincre 
de la facilité avec laquelle des erreurs ont pu s'introduire dans la tradition manuscrite, 
il suffit à quiconque de copier — à la main! — une page de n'importe quel texte francais 
contemporain (si possible dans des conditions qui ne soient pas optimales) !. 

Ainsi, la critique textuelle informe toute lecture d'un texte antique ou médiéval. 
Qu'on y accéde en traduction ou dans l'original, chaque texte résulte en effet du choix 
de variantes et de tentatives d'émendation. Pourtant, cette méthode fait rarement l'objet 
d'un enseignement à part entiére, que ce soit sous la forme de cours de critique textuelle 
ou bien au fil de la lecture des textes. Elle semble effrayer les étudiants et plus d'un 
enseignant — l’apparat critique constituant alors une marge particulièrement redoutable. 
Or ses principes sont simples et accessibles à tous. 

Ce texte issu d'une conférence à la session CLELIA 2018 constitue la tentative, 
nécessairement bréve et imparfaite, de donner quelques clefs permettant d'intégrer 
l'enseignement de la critique textuelle dans des cours de grec ancien. Il s'agit de montrer 
qu'il est facile pour un enseignant, y compris sans expérience préalable de la critique des 
textes, de transmettre aux étudiants un instrumentaire susceptible d'étre réinvesti, tout 
au long de leur parcours intellectuel, au service des lectures les plus diverses (littéraire, 
linguistique, historique, ecdotique, etc.). 


1. L'expérience en a été faite, notamment, avec des collégiens et lycéens lors d'ateliers organisés 
dans des établissements d'enseignement secondaire, par Marion Bellissime et l'auteur, dans le 
cadre du programme «Horizons antiques » de l'association «Journées Découvrir l’ Antiquité». 
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Il ny a pas lieu de réserver cet outillage à quelques-uns, qui seraient appelés à donner 
des éditions critiques, tandis que les autres se verraient ainsi privés de la possibilité de 
comprendre le processus par lequel ont été établis les textes à partir desquels ils travaillent. 
Cela étant, il va de soi que la méthodologie critique n'est vraiment utile qu'à des étudiants qui 
possèdent déjà une solide connaissance de la langue et de la culture. On pourrait d'ailleurs 
songer à valoriser les remarques relevant de la critique textuelle dans les épreuves telles 
que l'explication de textes aux concours des ENS, du CAPES et de |’ Agrégation. 

Le lecteur trouvera en fin d'article une bibliographie dans laquelle les titres précédés 
d'un astérisque constituent un vade-mecum bibliographique. Celui-ci est briévement 
commenté dans la première partie de l'article, notamment pour distinguer les ouvrages 
utiles aux étudiants et ceux qu'il faudrait plutót réserver aux enseignants. Dans la seconde 
partie sont exposés quelques principes généraux, tels que les ont formulés des pionniers 
de la critique des textes grecs anciens (il convenait de choisir un domaine délimité, mais 
la méthode peut étre transposée à bien d'autres traditions textuelles, y compris dans la 
littérature moderne — Shakespeare, Milton, etc.). Troisiémement sont indiqués quelques 
exercices inspirés par les conférences de la session CLELIA 2018. 

La critique des textes a rarement fait l'objet d'un cours à part entiére, en tant que 
matiére séparée des autres — en France du moins. On peut d'ailleurs tout à fait l'intégrer 
aux diverses formes canoniques d'enseignement des textes anciens, comme le cours sur 
auteur ou sur ceuvre. Elle entretient un lien particulier avec l'étude des manuscrits (la 
paléographie et la codicologie), mais n'en présuppose pas une connaissance approfondie. 
Cela étant, elle se nourrit, dans le meilleur des cas, d'un savoir encyclopédique qui embrasse 
l'ensemble des sciences de l'Antiquité. C'est le sens des remarques liminaires apposées 
à ses Exercices critiques par É. Tournier, qui inaugura le cours de critique textuelle à 
l'École pratique des hautes études, dans le dernier quart du xix? s. : 


Est-il besoin de dire qu'en séparant, pour la première fois, le cours de Critique verbale de 
celui de Paléographie, comme en faisant une place à part à l'explication des auteurs, on 
n'entend aucunement tracer une ligne de démarcation arbitraire entre les objets mémes de 
ce triple enseignement? Distinguer ces objets, ce n'est pas méconnaitre le lien qui les unit. 
Ils se tiennent de telle facon que l'esprit qui en considére un est à chaque instant ramené 
vers les autres. Et c'est précisément ce qui nous permettra de restreindre notre programme 
sans mutiler notre enseignement. On peut méme dire qu'aucun autre choix n'aurait eu, à cet 
égard, les mémes avantages. En effet, à considérer par un certain cóté toutes les parties si 
diverses qui composent la vaste science de l'Antiquité, sans en excepter celles qui ne sont 
point de notre domaine, on voit qu'il n’y en a aucune qui ne soit, ou ne puisse devenir, une 
auxiliaire pour la critique des textes. Si la Paléographie procure à l'éditeur les matériaux 
de son travail, la Grammaire lui en fournit le principal instrument. D'autre part, il ne suffit 
pas de bien connaitre l'auteur qu'on publie : on ne saurait impunément ignorer son époque, 
ses imitateurs, ses modèles, l’histoire du genre auquel appartiennent ses écrits, en d'autres 
termes, se passer du secours de l'Histoire littéraire. Pour tout ce qui regarde l'orthographe, 
quelquefois si difficile à fixer, l'Épigraphie? offre à l'éditeur des lumières que rien, souvent, 
ne peut suppléer. Il n'est guére de textes qui ne le forcent, à chaque instant, d'interroger 
l'Archéologie ou la Géographie, la Mythologie ou l'Histoire. En un mot, les recherches que 
peut exiger son travail n'ont d'autres limites que celles de l'érudition même. Que faut-il 
conclure de là? C'est que l'enseignement de la Critique verbale est moins une des parties 
qu'une des formes de l'enseignement philologique. (Tournier 1875 : x) 


Au terme de ces préliminaires, il faut noter que, plus que d'autres domaines, la critique 
des textes grecs et latins semble avoir fait l'objet par le passé d'un genrage masculin 
particuliérement fort. Les noms d'hommes semblent bien occuper plus de 99 % des ouvrages 


2. Il convient notamment d'ajouter à cette énumération la papyrologie, qui s'est développée en 
grande partie aprés la date de parution du manuel de Tournier. 


Eléments pour un cours de critique textuelle : l'exemple du grec ancien 181 


retracant son histoire, comme ceux de Kenney et de Timpanaro. On devra sans doute porter 
à ce probléme une attention particulière dans l'enseignement. On pourra faire valoir, en tout 
cas, des modèles proprement héroiques, comme celui d' Anne Dacier. Celle-ci, à une époque 
pour laquelle l'érudition était inconciliable avec la modestie exigée du genre féminin, fut 
l'auteure de quatre volumes parmi les meilleurs de la collection Ad usum Delphini?. Ses 
trouvailles ont parfois pu être invisibilisées par l’œuvre de son père, Tanneguy Le Fèvre, et 
de son mari, André Dacier, lequel reçut plus d'honneurs qu'elle malgré des talents moindres, 
et n'ont pas toujours rencontré chez ses successeurs l'attention qu'elles méritent^. À cet 
égard, il n'est pas inutile de rappeler le jugement de son contemporain Adrien Baillet : 


Ceux qui ont entrepris de faire voir par des Dissertations Apologétiques, que les Dames 
sont capables de l'Étude des belles Lettres, semblaient avoir borné cette aptitude à la 
Poésie, à l'Histoire, à la Philosophie, & aux autres connoissances, qui dépendent plus des 
qualités naturelles, que de celles qu'on acquiert par le travail & le long éxercice. Jamais ils 
n'auroient osé y comprendre la science épineuse de la Critique, si Mademoiselle le Févre 
n'en avoit donné un éxemple capable de fermer la bouche aux plus envieux d'entre les 
hommes... Ses Notes font voir par tout beaucoup de netteté d'esprit & d'érudition; ses 
corrections sont judicieuses. (Baillet 1725 : Livre 2, 271) 


2. VADE-MECUM BIBLIOGRAPHIQUE : AVANTAGES ET INCONVÉNIENTS DES PRINCIPAUX 
OUVRAGES D?INTRODUCTION AU POINT DE VUE DE L?ENSEIGNEMENT 


Les indications qui suivent sont nécessairement sommaires et schématiques. Elles ont pour 
seule fonction d'aider à s'orienter les lecteurs peu familiers de la matière. Les inévitables 
lacunes et simplifications tiennent autant à la visée de l'article qu'à l'ignorance de son auteur. 

Le livre de Timpanaro? offre l'avantage de proposer à la fois une rétrospective concise 
du développement méthodologique de la critique textuelle, et d'étre disponible dans une 
traduction francaise récente (avec de précieuses indications bibliographiques sur les derniers 
développements méthodologiques en critique textuelle). Le livre de Kenney‘, plus exhaustif, a 
un sujet plus restreint que les usuels d'histoire de la philologie, puisqu'il porte exclusivement 
sur l'histoire des éditions critiques. Le premier pourra faire partie des lectures conseillées (ou 
imposées) aux étudiants. Le second pourra aider l'enseignant à choisir des sujets d'exercice. 

L'ouvrage de Dain’ permettra aux étudiants de se familiariser avec la culture manuscrite, 
dans tous ses aspects, depuis l'Antiquité jusqu'à la Renaissance. Le vade-mecum 
bibliographique comprend deux ouvrages consacrés à la critique des textes latins, sans 
équivalent pour le domaine grec : celui de Hagen? est un livre d'exercices mécaniques, 
qui peuvent étre donnés tels quels; celui de Havet? offre une typologie trés détaillée des 
fautes possibles, au sein d'un traitement d'ensemble de la matiére. Les volumes de scripta 
minora d’Irigoin ? contiennent autant de lectures stimulantes qui synthétisent bien souvent 
ce qui s'est fait de mieux en France en matiére de critique textuelle. 


Shelford (2007 : 86-87). 
Cannavale (2012). 

Timpanaro (2016). 

Kenney (1974). 

Dain (1975). 

Hagen (1879). 

. Havet (1911). 

10. Irigoin (1998) et Irigoin (2003). 
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Le traité concis (34 pages !) de Maas '', également disponible en traduction anglaise, 
brille par sa systématicité, mais pèche à l'occasion par excès de simplisme ou de rigidité. 
Pasquali ? en prend le contre-pied, tant par son refus d'appliquer mécaniquement un 
systéme que par son exposé brillant de nombreux cas concrets. 

Les volumes de Renehan P et de Tournier ^ sont des recueils de problèmes textuels. 
Ils s'apparentent à des recueils d'adversaria ou d'émendations, mais s'en distinguent par 
leur dimension pédagogique. On pourrait d'ailleurs puiser, dans les recueils d'adversaria 
des grands philologues, les passages se prétant aux exercices les plus fructueux. Le livre 
de Renehan s'efforce de couvrir tous les phénomènes de corruption textuelle, avec une 
discussion ample de chaque probléme. Le volume de Tournier est issu de ses premières 
années d'enseignement à l'EPHE : l'argumentation est plus serrée, et le choix des passages 
est guidé plus par les nécessités du séminaire que par la volonté de couvrir tout le champ; 
mais il a ce charme particulier qu'un grand nombre de conjectures émanent non de 
l'enseignant, mais des étudiants, comme le rappelle Tournier en introduction : 


Ces conjectures, qui occupent dans notre recueil une place assez notable, doivent toujours 
étre considérées comme propres aux éléves à qui elles sont attribuées : en d'autres termes, 
si on leur fait l'honneur de les citer, ce devra étre, exclusivement, sous le nom dont elles 
sont signées. À plus forte raison, en faut-il dire autant des observations critiques suivies 
de la mention « Communiqué par ...» Là, en effet, ce n'est pas seulement la correction 
qui est due au signataire, c'est encore le choix du texte, souvent la découverte de la faute, 
quelquefois la rédaction méme. Les conjectures anonymes appartiennent en propre au 
Directeur-adjoint de la Conférence. [...] On remarquera peut-étre que le nombre de ces 
conjectures sans nom d'auteur devient, relativement, beaucoup plus considérable vers 
la fin du fascicule : la faute en est à une rencontre fortuite de circonstances qui a fait 
perdre, d'un coup, à notre Conférence, dans le courant de l’année dernière, tout ce qu'elle 
comptait d'éléves suffisamment exercés à ce genre de travail. Les derniéres feuilles ont 
cela, encore, de particulier, qu'on y a mentionné, en note, quelques conjectures dues à des 
éléves de l'École normale. On en aurait eu, certainement, un bien plus grand nombre à 
citer, si la critique des textes était à l'École normale, comme à l'École des hautes études, 
l'objet d'un enseignement spécial et distinct. (Tournier 1875 : 11-11) 


Sur ce décalage remarquable entre l'ENS et l'EPHE, Pascale Hummel fait d'ailleurs 
cette remarque éclairante : 


Le róle scientifique joué par É. Tournier ne saurait étre assez souligné. Le fait qu'il ait 
été maitre de conférences à l'École normale n'a sans doute pas grand-chose à voir avec 
l'innovation méthodologique que représenta son enseignement à l' EPHE. La création, favo- 
risée par l'École normale, d'un institut d'études extérieur à elle prouve autant la capacité 
d'innovation dont elle était capable que l'incapacité où elle se trouvait de se transformer 
elle-même de l’intérieur et la nécessité où elle était par conséquent de créer, à l'extérieur, 
des lieux où puissent se réaliser des desseins et des virtualités irréalisables à l’intérieur. 
É. Tournier, formé à Besancon par H. Weil qui avait été lui-méme l'éléve de G. Hermann, 
trouvait à l'EPHE, plus qu'à l'École normale où son enseignement s’inscrivait dans le cadre 
conventionnel d'une formation générale, le contexte idéal où expérimenter un enseignement 
spécialisé importé d'Outre-Rhin et encore trés marginal en France. (Hummel 1995 : 209) 


Les ouvrages de van Groningen , un peu comme celui de Dain préalablement cité, peuvent 
donner aux étudiants un apercu d'ensemble de toutes les questions relatives à la critique 


11. Maas (1960). 

12. Pasquali (1952). 

13. Renehan (1969). 

14. Tournier (1875). 

15. Van Groningen (1963, 1967). 


Eléments pour un cours de critique textuelle : l'exemple du grec ancien 183 


textuelle. En particulier, il est nécessaire que les étudiants puissent voir (sous forme de photo- 
graphies) des manuscrits : aux chrestomathies comme celle de van Groningen, on peut ajouter 
aujourd'hui le recours aux sites des bibliothéques qui, comme la BNF ou la Vaticane, ont déjà 
mis en ligne une trés grande partie de leurs manuscrits grecs. Enfin, le court traité de West !6, 
qui touche à toutes les questions susceptibles d'affleurer pendant le processus de réalisation 
d'une édition critique, a parfois tendance à survoler les difficultés, mais donne quelques utiles 
conseils pratiques, par exemple sur la manière d'effectuer les collations. On retiendra les trois 
conditions qu'il formule pour qu'une leçon ou émendation soit satisfaisante : 


1. «Elle doit correspondre pour le sens à ce que l'auteur avait l'intention de dire, dans la 
mesure ou on peut le déterminer d'aprés le contenu.» 

2. «Elle doit correspondre en langue, en style et par tout aspect technique pertinent (métre, prose 
rythmée, hiatus, etc.) à une manière dont l'auteur aurait pu naturellement exprimer ce sens.» 

3. «Elle doit étre pleinement compatible avec le fait que les sources existantes donnent ce 
qu'elles donnent; en d'autres termes, la maniére dont la lecon prétendument originale a pu 
être corrompue en n'importe quelle autre leçon transmise doit être claire.» (West 1973 : 
48, traduction de l'auteur) 


3. QUELQUES PRINCIPES GÉNÉRAUX 


Armé de ce vade-mecum bibliographique, l'enseignant n'a plus qu'à se rappeler quelques 
principes généraux qui guident la critique des textes. Le premier, déjà suivi par les philo- 
logues de l'Antiquité, est celui de l'usus scribendi. Aristarque en avait une conception 
extrêmement restreinte, liée à sa méthode herméneutique : Homerum ex Homero... On 
peut discuter longtemps de la formulation exacte à adopter, qui doit embrasser les critéres 
linguistiques (et éventuellement métriques) et l'horizon culturel non seulement de l'auteur, 
mais aussi de ses contemporains (cf. les deux premières conditions de West, citées supra). 
Le second critère est celui de la /ectio difficilior : 


Si una ex iis (sc. lectionibus) obscurior sit, ceterae clariores, tum vero credibile est obscuriorem 
esse veram, alias glossemata. (Le Clerc 1712 : II, 293, cité par Timpanaro 2016 : 54, n. 32) 
«Si l’une de ces leçons est plus obscure et que les autres sont plus claires, alors il est vraisem- 
blable que la plus obscure est la leçon authentique, et que les autres sont des gloses.» 


Enfin, le troisiéme critére est celui des parentés entre les manuscrits. C'est ici ou il convient 
de faire un choix didactique : soit on se plonge dans la difficile étude du stemma codicum, qui 
nécessite le détour par la paléographie, la codicologie et l’histoire des textes, soit on admet par 
commodité un stemma déjà établi. C'est alors une fiction pédagogique, dans laquelle on part 
du principe que toute lecon dans l'apparat peut représenter l'archétype. Dans le cadre de cette 
fiction, il y a néanmoins lieu d'appliquer le principe de l’eliminatio lectionum singularium : 


Duo pluresve syzygiae, saepe concurrentes, pro una valent : duo pluresve codices unius 
syzygiae, ubi congruunt, pro uno valent. Ubi autem inter se dissentiunt, syzygia vel codex 
cum pluribus consentiens praesentem comitum aberrationem perimit. (Bengel 1763 : 21, 
cité par Timpanaro 2016 : 50) 

« Deux ou plusieurs groupes qui s'accordent ne valent qu'un; deux ou plusieurs manuscrits 
d'un méme groupe, quand ils s'accordent, ne valent qu'un. Mais quand ils s'écartent l'un 
de l'autre, un groupe ou un manuscrit s'accordant avec un plus grand nombre d'autres 
élimine la faute qui existe désormais dans ses fréres.» 


Pour les manuscrits dont la place stemmatique n'est pas établie, on se rappellera aussi 
que recentiores non deteriores, «les témoins plus récents ne sont pas (nécessairement) moins 
bons», puisqu’un copiste récent peut avoir copié fidèlement un manuscrit ancien et vénérable : 


16. West (1973). 
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Novitas enim codicum non maius vitium est, quam hominum adolescentia : etiam hic non 
semper aetas sapientiam affert; ut quisque antiquum et bonum auctorem bene sequitur, 
ita testis est bonus. (Wolf 1795 : vu, cité par Timpanaro 2016 : 61) 

«Le caractére récent des manuscrits n'est pas un mal plus grand que la jeunesse chez 
l'homme : là non plus, l'áge n'apporte pas toujours sagesse; c'est dans la mesure ou 
chaque manuscrit suit un modèle ancien et fiable qu'il s'avére être un bon témoin.» 


On doit en effet distinguer entre l’âge externe d'un texte (l’âge du manuscrit) et son age 
interne, et un manuscrit plus récent qu'un autre peut conserver des leçons plus anciennes : 


Ich setze es hier nemlich voraus, dass das innere Alter, vielmehr muf beobachtet werden, 
als das dusserliche, so nur auf dem Alter des Pergament und der gebrauchten Schrifizüge 
beruhet; wonach freylich ein Codex ausserlich älter seyn, (das heißt eher, der Zeit nach, 
geschrieben worden seyn) kan, als ein und mehr andere, die erst drey-vier Jahrhunderte 
nachher abgeschrieben worden ; aber das innere Alter ist oft bey diesem letzten viel grösser 
als bey jenen. (Semler 1760-1769 : vol. III/1, 88-89, mentionné par Timpanaro 2016 : 56) 

« Je suppose ici qu'il faut observer l'áge interne plutót que l'externe, qui repose seulement 
sur l’âge du parchemin et des écritures. Ainsi, un codex peut bien être plus ancien (c'est- 
à-dire avoir été écrit plus tót) que tel ou tel autre copié trois ou quatre siécles plus tard ; il 
arrive souvent pourtant que ce dernier ait un áge interne bien plus élevé que le premier. » 


La copie manuscrite a lieu selon les quatre étapes suivantes : 

1. lire un texte (souvent par membres de phrase ou par phrases entières); 

2. le retenir; 

3. se le dicter; 

4. l’écrire. 
Cette théorie, formulée par Alexandre-Marie Bracke-Desrousseaux (1861-1955) "7, permet de se 
prémunir contre une conception faussée de la critique textuelle, qui voudrait que, pour prétendre 
à la scientificité, il faille expliquer toutes les fautes par des mécanismes paléographiques. 
Au contraire, on peut proposer une typologie générale des fautes dans les textes manuscrits, 
mêlant à des degrés divers les dimensions paléographique et psychologique "5 : 

— confusion de lettres ; 

— glose substituée au mot authentique; 

— substitution arbitraire d'un mot à un autre; 

— glose ajoutée au texte; 

— intrusion; 

— lacune; 

— transposition; 

— remaniement. 


4. FORME DU COURS 


Il est bien sûr possible de proposer des cours magistraux, aussi bien théoriques que pratiques 
— soit qu'on fasse fond sur ses propres trouvailles, soit qu'on puise dans les éditions et les 
recueils d'autrui. Toutefois, il semble à la fois plus aisé et plus efficace de donner une large 
part à l'exercice pendant le cours. Dans ce domaine, l'enseignant peut tout à fait étre un 


17. Cité par Dain (1975 : 41). 


18. Typologie reprise à Tournier (1875 : xxvi-xxvin). Des typologies plus détaillées sont données par 
van Groningen (1963 : 88-102) et West (1973 : 15-29). La pertinence de telles typologies est mise 
en cause par Renehan (1969 : 1). Néanmoins, leur utilité pédagogique parait indiscutable, dans la 
mesure où elles offrent au critique inexpérimenté une première structure, appelée à être affinée 
progressivement et, peut-étre, dépassée en derniére analyse. 
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«maitre ignorant» P, dans un premier temps du moins, puisqu'il s'agit avant tout d'exercer 
son bon sens. Avec le temps, l'expérience et l'érudition permettent bien évidemment des 
progrès indéniables. Au moins trois types d'exercices peuvent être conçus : 

A) L'étude critique d'un extrait choisi (voir ci-dessous). 

B) La comparaison d'éditions critiques (exemple : [Platon], Théages). 

C) La recension d'une édition critique (exemple : Wilson [2015]). 

(* Exercice supplémentaire : étude d'une région du stemma.) 

Il serait trop long de développer les types B et C. Pour ce qui est de la comparaison 
d'éditions critiques, mentionnons simplement, parmi tant d'autres, le cas du dialogue 
Théagés faussement attribué à Platon. Celui-ci, relativement peu étudié jusqu' alors, a fait 
l'objet dans les vingt derniéres années d'un regain d'intérét qui a donné lieu notamment 
à deux monographies comportant des éditions critiques”. Un tel texte — et il ne serait pas 
difficile de trouver des cas semblables dans d'autres domaines de la littérature — se préte 
parfaitement à l'exercice de type B, d'autant plus que la brièveté du texte permet d'envisager, 
dans les meilleures conditions, une prise en compte de la totalité. Quant à la recension 
d'une édition critique, qu'elle aboutisse ou non à une mise par écrit, elle peut étre plus 
difficile, mais n'est pas fonciérement différente de l'exercice précédent, à ceci prés qu'elle 
est explicitement centrée sur une seule édition. L’enseignant choisira plus volontiers ce type 
d'exercices (type C) pour des textes ayant fait l'objet d'un intérét soutenu. Ainsi, préparer un 
compte rendu critique de l'édition d'Hérodote procurée par Wilson?! oblige à s'interroger 
sur les choix de l'éditeur, et peut permettre d'en faire de meilleurs. Il est bien sár possible, 
et en l'espéce, sans doute nécessaire, de se limiter à une portion du texte. Enfin, l'exercice 
supplémentaire consistant à étudier une région du stemma d'un texte donné permet, sur 
un dossier bien choisi, d'examiner l'ensemble des questions se posant lors de l'étude des 
parentés entre manuscrits : il reléve donc à proprement parler de l'histoire des textes, mais, 
dans la mesure ou il repose en grande partie sur l'analyse des fautes, il peut servir à faire le 
lien entre l'enseignement de critique textuelle et celui de l'histoire des textes. 

La principale difficulté dans la préparation d'exercices de type A tient à la sélection des 
extraits à commenter. Il faut des textes présentant un intérét particulier au point de vue de 
la critique textuelle. Comme remarqué précédemment, les recueils, à commencer par ceux 
de Tournier et de Renehan, peuvent fournir un point de départ commode. L'enseignant peut 
aussi chercher des exemples dans ses propres lectures : c’est la meilleure manière d'acquérir 
l'automatisme consistant à toujours prendre en compte l’apparat critique, ainsi qu'à dépister 
les passages oü le texte transmis, qu'il présente ou non des variantes, est susceptible d'étre 
corrompu. Ce qui suit est la présentation d'un des dossiers étudiés lors de la session CLELIA 
20187”. Le point de départ est fourni par une entrée du lexicographe Hésychius : 


Kepxétat: £0vog Tvótóv (Hsch., K 2328 Latte) 
"Ivétkóv cod. : Xiwótkóv corr. Christol 


La correction proposée par Alain Christol” paraît irréprochable : il s'agirait de l'haplo- 
graphie d'un o en méme temps que d'un cas de banalisation. Les éditeurs successifs 


19. Pour cette notion, voir notamment Ranciére (1987). 

20. Joyal (2000) et Bailly (2004). 

21. Wilson (2015). 

22. L'étude de ce dossier a été suggérée par la conférence d'Alain Christol. D'autres dossiers inspirés 
par les conférences de Casper De Jonge (notamment l'émendation proposée par De Jonge 2012) 


ont été discutés lors de la session, mais ne sont pas présentés ici; que M. De Jonge et les autres 
participants soient néanmoins remerciés de leurs remarques à ce sujet. 


23. Christol (2008 : 331, n. 10). 
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d’Etienne de Byzance ont d’ailleurs retenu une correction analogue faite par Isaac Voss 
dans l'entrée Aotepovoia (Ivôwn cod. : Zivôti Vossius) ^. A l'appui de la correction qu'il 
a proposée, Christol cite une autre glose d'Hésychius, transmise sans indication d'origine 
(képka ` àkpíc, «sauterelle »), et rapproche un passage du Périple du Pseudo-Scylax : 


Metà dé Xwówóv Muéva Kepkétar rot Topétat £0voc. (Scyl., 73) 
«Après le lac Sindique, (on trouve) le peuple des Kerkétes ou Torètes. » 


Après avoir rappelé que la Sindique, région située à l’est de l’actuel détroit de Kertch, 
figure déjà chez Hérodote”, et que sa localisation est confirmée par l'épigraphie "$5, 
on peut notamment verser au dossier les occurrences suivantes : 


Zwvôur (Hansen : Xwoóíg H) - ñ XkvO(a. Kai f| nópvn. (Hsch., X 679 Hansen) 
«Sindique : la Scythie. Et la prostituée.» 

Zuwvôwôv Ot&6oaypua.- TO Tig yovoikóc. (Hsch., X 680 Hansen) 

«Fente sindique : celle de la femme.» 


Le locus classicus de l'entrée È 680 se trouve dans les Jambes d'Hipponax ?". La prostituée 
de l'entrée X 679 pourrait appartenir au méme poème, quoique West ne l'ait pas retenue 
dans son édition. 

Une correction analogue à celles de Vossius et Christol peut étre proposée pour une 
autre entrée d' Hésychius qui semble avoir échappé jusqu'à présent au zèle des critiques : 


Zivôor: EOvoc Tvótóv. Eot1 08 MOAI £kei Zwotwócg Atv Aeyopévn. (Hsch., X 682 Hansen) 
"Iv8tkóv cod. : Xivótkóv correxi 

«Sindes : peuple indien [correction : peuple sindique]. Il y existe une ville appelée 
“Port-Sindique” (Sindikos Limen).» 


Le mécanisme de la faute serait le même que pour l'entrée K 2328. l'entrée corrigée prendrait 
certes un caractére pléonastique, mais cette objection n'est pas insurmontable ; le pléonasme 
peut méme avoir favorisé la faute, par souci d'élégance. D'autre part et surtout, si l'entrée n'est 
pas corrigée, alors le texte situe « Port-Sindique» en Inde (&kei renvoyant nécessairement à ce 
qui précède); or la localisation de cette cité en Scythie sindique est bien assurée". 
Une seconde correction peut étre proposée pour une entrée portant sur le méme sujet 

dans le lexique d'Étienne de Byzance : 

YMóvówocg: nóis TPOGEYI|s TH Xxv0(g £yovca Aiéva. "Evio1 òè l'opyinrnv koAo0o1. 

(St. Byz., X 320 Billerbeck) 

Yóvótkoc : an Xwótkóg Muhv corrigendum ? 

«Avocat [correction : «Port-Sindique »] : cité jouxtant la Scythie, dotée d'un port. Certains 

l'appellent Gorgippe. » 


La raison pour laquelle les éditeurs n'ont pas intégré une correction somme toute évidente 
tient au contexte de l'entrée : en effet, elle est bien à sa place dans le texte transmis, ou 
elle s’insère dans l’ordre alphabétique entre les entrées Xóvayog et Xóvvaóa. Si l’on édite 
le texte de l’épitomè d'Étienne, il convient donc de maintenir le lemme transmis, mais il 
ne fait guére de doute qu'à une étape antérieure de la tradition lexicographique on lisait 
bien Zwôwdc Muhv. Cet exemple illustre néanmoins que le texte ne peut être interprété 
correctement sans une réflexion critique sur son établissement. 


24. Voir St. Byz., A 503 Billerbeck. 

25. Voir Hdt. IV, 86. 

26. Pour une synthése de ce dossier épigraphique qui a fait l'objet de débats, cf. Tochtasev (2006). 
27. Hippon., fr. 2a West. 

28. Hansen et Nielsen (2004 : 944, s. v. « Gorgipp(e)ia»). 
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Enfin, il faut discuter la forme Xívóau souvent confondue avec l’ethnique Xivôot 
«Sindes » ?. On la trouve chez Etienne de Byzance : 
Livda: nóis npóc TH MeyóXo kéAro tis Ivóutijc, EvOEv oi kañoúuevor Livdat. (St. Byz., 
= 168 Billerbeck) 


« Sinda : cité au bord du Grand Golfe de l'Inde, d’où viennent ceux qu'on appelle les 
Sindes (Sindai).» 


La cité de Sinda est également attestée, avec une localisation semblable, par Ptolémée??; un 
peuple indien de Sindes (Zivôor) est attesté par le même auteur?!, qui connaît un archipel au 
nom similaire (ai Zivôou) au large de la péninsule indienne”. Il est tentant de proposer la 
correction Xívóox pour le nom du peuple (en s'appuyant sur le parallèle fourni par Etienne 
de Byzance). Malheureusement, il n'existe pas d'édition critique satisfaisante de l'ensemble 
de la Géographie, fondée sur une prise en compte méthodique de toute la tradition 
manuscrite. Cela étant, l'édition partielle procurée par Louis Renou*’, qui comprend les 
passages en question, repose sur une étude attentive de la tradition. On y apprend que la 
correction Łivõo pour Xívóot a déjà été proposée sur une carte du manuscrit Urbinas gr. 83 
(s. XV). La correction, quoique satisfaisante pour l'esprit, n'est pas certaine, et Renou a sans 
doute raison de la rejeter dans l'apparat. Quant à l’archipel des Sindes, dont la localisation 
fait probléme, son rapport avec la cité et le peuple reste incertain. Les noms de la cité, du 
peuple et de l'archipel ont vraisemblablement un rapport étymologique avec le nom de 
l'Inde. Étant donné le peu de mentions de la cité de Sinda et de son peuple de Sindes, il est 
peu probable que cette tradition ait influencé celle relative à la Scythie sindique. 

Ces orientations bibliographiques, ces principes généraux et ces pistes d'exercice n'ont 
d'autre ambition que de servir d'amorce à l'enseignement. Car ce sont la pratique régulière 
et l'expérience accumulée, à commencer par l'attention prétée dans chaque lecture aux 
problémes d'établissement du texte, qui permettent aux étudiants comme aux enseignants 
d'acquérir progressivement une méthodologie critique. S'engager dés que possible sur 
cette vole est une condition sine qua non pour lire les textes antiques sans naiveté, quels 
que soient par ailleurs les objectifs et les présupposés qui déterminent la lecture. 
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